智算之渴如何解?

科技 2024-04-03 11:39 阅读:19

算力几乎决定了人工智能技术创新的上限。作为数字时代的先进生产力,算力是推动人工智能、区块链、云计算、大数据等技术创新与应用的基础支撑。尤其是当下,大模型发展进入了深水区,躬身入局的参与者们对算力的需求愈发复杂。究竟要具备怎样的能力,才能够建设好AI时代的算力底座?

一面AI急需 一面算力浪费

数字金融、智能驾驶、生物医疗、智能制造……没有人会怀疑,人工智能大模型会在今天,也会在未来几年“+千行百业”,成为人类目前能拥有的最趁手的工具之一。但同时,数据不均衡、算力集群效率低、模型可信度有待考验、云边端算力资源没有有效协同……发展大模型的阶段不同,所“涌现”的问题复杂性和关键难点不尽相同,对AI支撑能力体系的要求也各具侧重。

在模型训练阶段,用户本身往往有很强的算法能力,但需要解决算效的难题。据了解,OpenAI在训练GPT4过程中的算力利用率约为35%,听起来偏低,其实已是行业正常水平。

如何才能释放更多的算力?这可能像中彩票一样难得。只有算、网、存、管四方面能力全面提升,才能够形成极致算效体系,从而提升在模型训练当中的算力利用率。

来到垂直场景适配阶段,用户对于算效的需求不像前者那样强烈,但他们需要极高的模型精度和效率——不同于To C场景中60%左右的精准度,行业模型精度的门槛可以达到95%。

因此,在行业实际落地当中,如果想要开出一个比较好的“精度盲盒”,需要考虑的因素更为复杂,包括数据安全合规、高质量数据的治理、调优的硬件加速和软件优化等等,这意味着深入行业,形成专业增强体系。

再到大模型应用部署运行阶段,这样一群每天需要AI应用最多的用户,他们的需求是极致的“高效稳定”。一方面要加速做好模型的精简、蒸馏、压缩等各个环节的处理,另一方面要实现轻量级一键式甚至分钟级的部署,同时能在稳定的运行环境里,对资源进行实时地调用、健康全面地监管。

以前我们会想,超高算效、超大算力、超强稳定是不可能三角吗?但如今,大模型发展至此,对算力服务的确提出了如此复杂和严苛的要求。

在以大模型为焦点的新一轮AI竞赛中,智能计算作为推动产业发展的关键引擎,已经不再局限于算力性能这一单一竞争要素。算法协同优化、数据处理能力、模型可解释性以及与特定行业应用的融合度,都成为了智能计算能否成功推动技术创新和实际落地的核心因素。

而没有满足需求的智算服务,发展大模型就是天方夜谭。

“摸彩票”还是“开盲盒”?

大模型闪耀在聚光灯下,背后是不同的发展阶段的客户涌现出来的对于AI支撑能力体系愈发复杂的需求。

不管是万卡时代的“算效彩票”还是深入行业的“精度盲盒”,以及高效调用的“服务瓶颈”,如何解决这些复杂问题,满足这些来自不同客户的不同需求,在大模型的发展之路上建立起一套全面的AI的支撑能力体系,是当下急需解决的问题。

3月29日,宁畅发布“全局智算”战略,并揭幕了包括“AI算力栈”在内的一系列战略性新品与系统解决方案,旨在有效解决大模型产业落地的全周期问题。

“全局智算”,顾名思义,是具备全栈智能计算能力,以及涵盖硬件、软件、算法、液冷和服务质量等多个维度的系统性AI计算方案,背后是打造AI时代最坚实算力底座的决心。

这个底座的最底层是硬件资源层,比如通用服务器、GPU、整机柜、存储等多种形态的产品。

硬件层之上是集群设计层,这一层绝不是将海量硬件进行简单的连接堆叠,而是通过分析整个业务运行的特征和系统的量化需求,提供从微架构、网络、存储、AI模型特征等一系列的方案设计。

集群层以上是算子优化层,为了降本增效,方案提供了整体的AI算子自由化能力,减少模型执行的时间,提高能效比,使得AI能在有限的资源上高效运行。

再往上是中台层,可以提供基于AI算力系统深度整合的工作栈。最上面则是业务层和场景层。

整体来看,全局智算以全体系、全液冷、全服务、全场景、全行业、全阶段的六“全”能力,可满足大模型开发、适配、部署等全方位需求。

明年智算超三分之一

今年是大模型落地产业应用的关键一年。随着外部环境的变化,大模型从参数竞赛走向商业化、产业化的落地阶段,在这个阶段,单纯提供算力硬件已经远远不够,需要的是支撑能力体系的整体升级,就像“木桶原理”一样,各类能力都不能有短板。

同时,涉及算法、算力、数据三个维度的复杂系统需求也会不断涌现,而目前的智算中心在算效、精度和服务方面的表现还远不能支撑。全局智算战略正是希望向上解决极致算效、精度增强、高效稳定三个复杂需求,向下扎根千行百业,让大模型真正落地成为各行各业的新质生产力。

发布会上透露,为加速赋能用户,国内首个AI算力栈——宁畅NEX AI Lab(Nettrix AI Open Lab)已在桐乡市成功落地并开放预约试用,用以展现应用场景优化、行业智算定制解决方案,通过免费提供短期的软、硬件服务,带来大模型、数据科学、推荐系统等解决方案工作流的先进体验。

工业和信息化部、中央网信办、教育部等六部门联合印发的《算力基础设施高质量发展行动计划》提出,到2025年,中国算力规模超过300EFLOPS,其中智能算力占比达到35%。另据统计,目前全国正在建设或提出建设智算中心的城市已超过30个。

在智算中心建设大潮下,AI算力栈方案以其全面、灵活、深度的支撑能力,可为行业级、企业级智算中心的构建提供强有力支持,确保智算中心的建设既符合当前业务所需,又具备前瞻性与适应性。英特尔AI首席架构师吴震华强调:“第四代/第五代英特尔® 至强® 处理器可扩展处理器的卓越性能,将为宁畅AI算力栈带来更强助力。”

未来,“AI算力栈”方案将进一步落地汽车、互联网、制造、金融、能源、科研等领域,为数字化转型、智能化升级提供核心引擎。