生成式AI技术浪潮,给云计算产业链、数据中心等基础设施带来了多维度、大规模的需求。 然而,AI不仅仅是数据中心的场所,从业者正在将AI功能加载到边缘和终端中。 在不久的将来,人工智能将深入全球数十亿台设备,惠及每一位消费者的工作和生活。
传统上,人们所指的人工智能是基于服务器的人工智能或生成式人工智能。 但我们相信,AI也可以存在于边缘,存在于网络中,从传统的数据端一直到存储和服务器,并融入到每一个计算过程中。 在上月底举行的ARM技术研讨会年度技术大会上,ARM高级副总裁兼基础设施业务部总经理Mohamed Awad告诉记者。
Mohamed Aad,ARM 高级副总裁兼基础设施业务部总经理
从云服务和数据中心的基础设施端,到手机等智能设备,再到让物联网数据更贴近数据源和用户的边缘端,Arm在AI领域已经或正在部署的每个节点都推出了解决方案。
AI市场的竞争本质上是开发者生态的竞争。 为了支撑AI时代用户的定制化和专有化需求,ARM以完整、全面的计算平台全方位赋能开发者生态,成为产品发布和产业创新的“加速器”。
将 AI 功能引入云边缘
在传统的基础设施架构中,该中心是一个标准的现成CPU,内存和多个加速器连接到CPU。 因此,每个加速器都需要通过 CPU 访问内存。 在人工智能时代,很明显,这样的架构无法应对人工智能所需的数据量和计算量。 大多数云服务提供商和数据中心基础设施提供商迫切需要定制 CPU,以便每个 CPU 内核可以直接连接到每个加速器,以实现系统级内存一致性。
Arm的独特之处在于,它使芯片设计人员能够按需定制芯片架构,并基于强大的ARM软件生态系统为整个开发过程赋能,从而加快产品上市时间。 这也是为什么英伟达、亚马逊、阿里云、Microsoft等国内外领先的云厂商都选择开发自己的基于ARM架构的算力芯片。 NVIDIA GH200 Grace Hopper 超级芯片使用的架构由 NVIDIA 和 ARM 联合定制。 该架构由 72 个 ArmNeoverse 内核组成,结合 NVIDIA 的 GPU,每个内核直接连接到每个加速器,与基于 x86 的系统相比,AI 性能提高了 10 倍。
在智能终端领域,围绕手机的技术和场景创新进入了白热化阶段。 手机不仅是消费者最常用的通信娱乐设备,也成为移动办公的载体,甚至是大机型的部署目标。 手机制造商迫切需要一个能够根据各种消费者需求进行扩展的计算基础。
在选择CPU集群的配置时,手机厂商往往会根据其最终目标受众的用户场景选择合适的CPU配置,这也是Arm的CPU战略的一部分,使合作伙伴能够为其客户选择合适的CPU性能。 在当下的高端智能手机市场,我们经常可以看到很多不同的想法,每家公司都有不同的策略,这正是Arm所期望看到的ARM IP灵活配置带来的多元化和差异化。 Arm今年推出了2024年整体计算解决方案(TCS23),该解决方案集物理IP、架构、工具和软件于一体,为SoC开发提供一站式、极简的技术支持。 作为 TCS23 的一部分,Armv9 Cortex 计算集群已连续第三年实现了两位数的性能提升。 Arm 旗舰 GPU Immortalis 不仅率先将光线追踪和可变速率着色能力引入手机,而且全新的第五代 GPU 架构还优化了 TCS23 中外部内存、CPU 集群和系统级缓存之间的交互,以提高整体性能。
我们面向移动平台的 ARM 综合计算解决方案支持在移动设备上实现 AI。 此外,我们的 ARM Cortex-M52 和 Cortex-M55 是支持 AI 的产品,并持续赋能和支持 AI 开发。 穆罕默德·阿哈德说。
当AI进入边缘时,物联网不仅是设备信息的采集和发送者,还可以利用AI实现高级维护、传感器融合、工业控制等功能。
ARM 为物联网领域提供全面的物联网解决方案,通过结合硬件 IP、平台软件、机器学习 (ML) 模型、工具等来简化开发并加速产品设计。 Arm Helium 技术是 Cortex-M 处理器系列的矢量扩展,可显著提高小型嵌入式设备的机器学习和数字信号处理能力。 在 ARM 最新的 Cortex-M52 中,ARM Helium 是 ARMV8Cortex-M52 在 1M 架构系列中增加了 150 条新的标量和矢量指令,使其能够实现 2 种数字信号处理能力7 倍提升和 5 种机器学习功能6 倍提升。 面对物联网设备场景细分化、多样化的特点,ARM Corstone解决方案提供了关键的IP集成配置,使能不同性能要求的物联网产品的快速开发,真正将AI计算推向边缘。
以全面的计算平台赋能开发者生态系统
人工智能在为全球计算行业带来无限商机的同时,也带来了严峻的计算挑战。 一方面,互联设备和数据流量的指数级增长给数据中心等计算基础设施带来了沉重压力另一方面,随着先进制造工艺接近其物理极限,摩尔定律的发展速度放缓,使得在性能和功耗之间取得平衡变得越来越困难。
面对计算行业的最新趋势和需求,ARM已经从最知名的IP提供商转型为计算平台公司,专注于IP授权业务的同时,也专注于通过完整而全面的解决方案为合作伙伴提供灵活的选择,帮助他们更快地将产品推向市场。 从移动平台到基础设施、物联网和汽车,Arm 推出了简化开发过程的计算平台,同时为芯片设计人员提供了更大的自由度,可以针对自己的场景和用例定制芯片。
除了 ARM Total Compute Solution、ARM Neoverse Platform、ARM Corstone 和 SOAFEE 等一系列计算平台外,Arm 最近还推出了 ARM Neoverse 计算子系统 (CSS) 和 ARM Total Design,以进一步激活生态系统的力量。
Neoverse 是 ARM 的服务器和基础设施产品线,Neoverse CSS 为用户提供优化性能所需的系统管理、电源管理、软件和开发工具,包括 Neoverse 内核、CMN 网状结构和系统 IP,使用户能够以更低的成本、更短的时间和更低的风险交付定制芯片。
Arm Neoverse CSS 为工程团队节省了相当于 80 名工程师一年工作的时间。 一位客户报告说,在使用 Neoverse CSS 后,他们的项目在短短 13 个月内就完成了从概念定义到流片的整个过程。 穆罕默德·阿哈德说。
Microsoft 的 Azure Cobalt 100 CPU 基于 Arm Neoverse CSS 构建,包含 128 个 Neoverse 内核。 Neoverse CSS 和 ARM 平台软件生态系统的优势使 Microsoft 有更多时间专注于独特的创新和优化,同时节省大量开发工作。 Arm预计,2024年,将有更多国内外云计算和数据中心相关厂商将第一代CSS设计投入生产。
在 Neoverse CSS 的基础上,Arm 推出了 Arm 综合设计生态项目,使得包括 AI、云、网络、边缘在内的基础设施应用能够广泛使用 Arm Neoverse 架构。 Arm将与Arm合作,提供来自Cadence、RAMBUS和Synopsys等合作伙伴的预集成和验证的IP和EDA工具,来自AdTechnology、AlphaW**e Semi、Broadcom、Capgemini和Faraday等合作伙伴的设计服务,来自Intel Foundry Services和TSMC等供应商的代工服务,以及来自基础设施固件**供应商(如Ammann Technologies)的商业软件和固件。
Cortex产品线,包括终端和边缘侧产品,也一直秉承软硬件紧密耦合的生态建设逻辑,为开发者提供整体支撑。 就 Cortex-M52 而言,开发人员以前必须经历一个复杂的开发过程,将三个计算单元(CPU、DSP 和 NPU)与三个不同的软件工具包相结合,以在低功耗处理器中实现数字信号处理和机器学习功能。 ARM 为使用 Cortex-M52 的开发人员提供单一工具链,以一致的开发流程处理传统计算任务、数字信号处理和机器学习工作负载,从而改善开发体验,同时显著缩短上市时间。
对于ARM来说,中国是一个重要的高增长市场,也是ARM最具创新性和潜力的市场之一。 ARM 在全球拥有 1500 万开发人员,其中 400 万在中国。
在服务器和基础设施方面,ARM Neoverse 正在全面拥抱本地生态系统和开源社区建设。 ARM中国全球副总裁邹婷表示,ARM Neoverse在中国市场拥有众多客户,尤其是基础设施领域。 ARM积极参与数据中心、云计算等本地生态建设,以及Dragon Lizard等开源软件社区建设,帮助这些社区更好地融入全球ARM生态。 在终端和边缘端,ARM还为本地开发者提供一站式服务和丰富的生态资源。
邹婷,ARM中国区全球副总裁。
在ARM技术的支持下,在全球数十亿台设备上运行的推理将发生转变。 同时,需要业界共同努力,加速数据中心和设备之间AI训练和推理的共享,从而在提高AI安全性的同时,提高AI的效率和成本效益,最终使AI无处不在。
作者丨张欣怡编辑丨赵晨梅编辑丨Maria制片人丨连晓东