云上算力演进无止境,Amazon Graviton4 已起步

小夏 教育 更新 2024-01-29

2024年,亚马逊云科技发布了基于ARM架构的第一代GR**ITON芯片,开创了云计算厂商开发自己的通用处理器的先河。

在随后的几年里,越来越多的云厂商意识到,企业客户对云上算力性能的追求是无止境的,而满足这一需求的唯一途径就是从底层芯片开始全面重塑算力。

而gr**iton系列芯片也没有停下自己的脚步。 在不久前举行的2023 Re:Invent峰会上,亚马逊云科技发布了基于GR**ITON4的最新一代自研处理器GR**ITON4和R8G实例。

与上一代产品相比,GR**ITon4 具有更多内核、更高的内存带宽,以及性能和能效的显着提升。

同时,gr**iton4 针对实际工作负载进行了优化,而不是运行分数,这可以真正改善实际的用户体验。

截至 2023 年底,亚马逊云科技已使用超过 200 万个 gr**iton 处理器,推出超过 150 个基于 gr**iton 的云主机,用户超过 50,000 人。

其中,排名前 100 的 EC2 用户也在使用基于 Gr**Iton 处理器的云主机。

总体来说,推广还是比较诚恳的。

从公布的数据来看,gr**iton4 的计算性能整体上比 gr**iton3 提升了 30%。 其中,运行MySQL数据库的性能提升了40%,运行大型J**A应用的性能提升了45%。

一到四代 gr**iton

从肉眼可见,gr**iton4和gr**iton3一样,都采用了chiplet技术,这也是arm强烈推荐的技术路线。

Amazon Web Services 首席布道者 Jeff Barr 在他的博客中提到,GR**ITON4 使用了 96 个 Neoverse V2 内核,每个内核有 2MB 的 L2 缓存和 12 个 DDR5-5600 通道内存。

相比之下,上一代GR**ITON3的芯数为64,这次直接增加了50%。 内存带宽已从 307GB 增加到 5367GB s,整体提升75%以上。 L2 缓存也从 1MB 增加到 2MB,这在性能方面有很大帮助。

Neoverse V2 内核,也称为“Demeter”内核,基于 ARMV9 架构,面向 HPC、云计算和超大规模数据中心市场。

根据ARM官方数据,Neoverse V2的IPC比基于ARMV8架构的Neoverse V1内核提高了40%。 此前,GR**ITON3 和 GR**ITON3E 使用 Neoverse V1 内核的 ArmV8 架构。

从 Amazon EC2 副总裁 D**id Brown 的介绍中可以看出,Gr**Iton 的设计针对实际工作负载进行了优化,而不是针对运行分数进行了优化。

为了说明什么是“针对实际工作负载进行优化”,他分享了一张雷达图,该图看似复杂,但实际上非常简单。

雷达图列出了CPU微架构中涉及的主要参数,分为前端和后端两部分。

前端主要是指令相关部分,后端主要是功能执行单元。 当然,前端和后端之间还有一个命令控制器,负责将前端解码后的指令分发给执行单元。

CPU 微架构需要前端和后端之间的紧密协作。 如果前端效率不高,会导致后端执行单元等待新指令,从而产生性能瓶颈。 如果后端效率不高,执行速度太慢,新指令无法进来,也会导致性能瓶颈。

雷达图中也有数值,数字越小,工作负载对这个参数特性的依赖性越小,这意味着CPU的这个参数特性对整体性能的影响越小。

换言之,数字越小表示处理器对该工作负载的效率越高,数字越大表示工作负载对处理器的依赖性越高。

借助此雷达图,CPU 设计人员可以针对实际工作负载进行优化,而不是基于基准测试测试结果。

上图说明了基准测试中的场景,该场景放大了某些参数特征的影响。

例如,我们在这里看到 L3 缓存的值特别高,这会导致后端停顿的值很高。 此时,后端无法再接受新指令,这将造成性能瓶颈。

这张图右侧的三个雷达图显示了 Cassandra、Grovy 和 Nginx,它们在处理实际工作负载时会受到不同参数特征的影响。

可以看出,这些应用同时受到几种不同参数特性的影响。 如果要针对实际工作负载进行优化,则必须找到一种方法来降低这些数字。

例如,gr**iton4 对 gr**iton3 做了什么。

如上图所示,gr**iton4在运行MySQL时多维度下降,性能提升40%。 当然,这也与内存带宽等规格的提升有很大关系。

无论如何,最后的雷达图显示了用于实际工作负载优化的 gr**iton4。

除了规格的提升、实际工作负载的优化、日益复杂的安全威胁外,GR**ITON4 在安全方面也有了新的内容。

GR**iton4不仅继承了上一代处理器的安全特性,还增加了加密的高速硬件接口,以保护数据的安全性和完整性。

同时,gr**iton4 还新增了分支目标识别(bti-branch target identification)功能,可用于确保分支跳转到正确的目的地址,防止恶意软件使用分支中的跳转命令跳转到意图以外的段,从而提高系统的安全性。

与往年一样,新的 GR**ITON4 处理器随附带有处理器的 EC2 主机。

预览版中发布的第一个 EC2 是 R8G,这是一个内存优化实例,其 VCPU 数量和内存容量是上一代 R7G 的三倍。

这使得R8G在高性能数据库、大数据分析等大型数据集场景中更具优势。 R8G 的发布为内存敏感型工作负载提供了更好的性价比和能效。

2024年,亚马逊云科技发布了第一代自研的gr**iton处理器,亚马逊云科技成为首家研发自研通用服务器处理器的云厂商,这也是Arm服务器阵营再次站稳脚跟的里程碑事件。

为了扩大效益,发布了功能更强大的GR**ITON 2,随后GR**ITON 3在性能和能效方面不断提升。

事实上,去年亚马逊云科技还发布了 gr**iton3 的升级版——gr**iton3e,主要优化了浮点运算和向量运算场景下的性能,这些能力只有在高性能计算领域才被更多关注。

现在看来,亚马逊云科技在2024年发布的gr**iton处理器,以及相应的云主机,确实对服务器市场产生了很大的影响。

如今,gr**iton芯片的应用范围已经大大扩展。 这可以从亚马逊云科技 TOP100 客户也在使用 gr**iton 实例这一事实中看出。 例如,SAP 在使用 Gr**Iton 服务后,通过更快的分析速度将成本降低了 35%,并将碳排放量减少了 45%。

5年间推出4代芯片的亚马逊云科技,利用gr**iton为云厂商自研芯片探索了一条发展路径:每一代芯片都带来更高的性能、更丰富的选择、更低的成本,从而满足企业对云上算力性能的无尽需求。

end

相似文章

    Amazon Web Services 您的数据决定竞争力

    您的数据是您的差异化因素。当亚马逊网络服务首席执行官亚当 塞利普斯基 Adam Selipsky 在Re Invent大会上提出这一观点时,引起了观众的共鸣。事实上,人们普遍认为数据是最重要的生产要素,所有处于数字化转型中的企业都在问自己 我有多少数据?质量怎么样?它能有效地支持业务应用吗?如今,云...

    凝心聚力创新,光荣前行,泽塔云斩获多个奖项

    临近年底,好消息不断,泽塔云近期斩获多项荣誉,产品及解决方案大放异彩。荣获年度测绘科学技术奖 根据 国家科学技术奖励条例 和 中国测绘学会科学技术奖励办法 等规定,中国测绘学会开展了年度测绘科学技术奖 全国优秀测绘工程奖 青年测绘科技创新人才和测绘技术创新优秀单位,鼓励单位和个人诚信创新,攻坚克难,...

    《守护花开》嘉云学校丨孩子们注意力不集中,有时候也怪不出孩子

    近日,一部体现中国式家庭教育的电影 学爸 在各大院线上映,影片以 从小到小学 为切口,讲述了黄渤饰演的平凡父亲雷大利为了儿子顺利考上理想小学,被迫卷入 鸡宝宝 困境,以及父子之间一系列 斗智斗勇 的故事,这是一个荒谬的故事。其中,雷大理因教育儿子而崩溃的片段,让不少家长大喊 这是在玩 我 三个半小时...