2024年,亚马逊云科技发布了基于ARM架构的第一代GR**ITON芯片,开创了云计算厂商开发自己的通用处理器的先河。
在随后的几年里,越来越多的云厂商意识到,企业客户对云上算力性能的追求是无止境的,而满足这一需求的唯一途径就是从底层芯片开始全面重塑算力。
而gr**iton系列芯片也没有停下自己的脚步。 在不久前举行的2023 Re:Invent峰会上,亚马逊云科技发布了基于GR**ITON4的最新一代自研处理器GR**ITON4和R8G实例。
与上一代产品相比,GR**ITon4 具有更多内核、更高的内存带宽,以及性能和能效的显着提升。
同时,gr**iton4 针对实际工作负载进行了优化,而不是运行分数,这可以真正改善实际的用户体验。
截至 2023 年底,亚马逊云科技已使用超过 200 万个 gr**iton 处理器,推出超过 150 个基于 gr**iton 的云主机,用户超过 50,000 人。
其中,排名前 100 的 EC2 用户也在使用基于 Gr**Iton 处理器的云主机。
总体来说,推广还是比较诚恳的。
从公布的数据来看,gr**iton4 的计算性能整体上比 gr**iton3 提升了 30%。 其中,运行MySQL数据库的性能提升了40%,运行大型J**A应用的性能提升了45%。
一到四代 gr**iton
从肉眼可见,gr**iton4和gr**iton3一样,都采用了chiplet技术,这也是arm强烈推荐的技术路线。
Amazon Web Services 首席布道者 Jeff Barr 在他的博客中提到,GR**ITON4 使用了 96 个 Neoverse V2 内核,每个内核有 2MB 的 L2 缓存和 12 个 DDR5-5600 通道内存。
相比之下,上一代GR**ITON3的芯数为64,这次直接增加了50%。 内存带宽已从 307GB 增加到 5367GB s,整体提升75%以上。 L2 缓存也从 1MB 增加到 2MB,这在性能方面有很大帮助。
Neoverse V2 内核,也称为“Demeter”内核,基于 ARMV9 架构,面向 HPC、云计算和超大规模数据中心市场。
根据ARM官方数据,Neoverse V2的IPC比基于ARMV8架构的Neoverse V1内核提高了40%。 此前,GR**ITON3 和 GR**ITON3E 使用 Neoverse V1 内核的 ArmV8 架构。
从 Amazon EC2 副总裁 D**id Brown 的介绍中可以看出,Gr**Iton 的设计针对实际工作负载进行了优化,而不是针对运行分数进行了优化。
为了说明什么是“针对实际工作负载进行优化”,他分享了一张雷达图,该图看似复杂,但实际上非常简单。
雷达图列出了CPU微架构中涉及的主要参数,分为前端和后端两部分。
前端主要是指令相关部分,后端主要是功能执行单元。 当然,前端和后端之间还有一个命令控制器,负责将前端解码后的指令分发给执行单元。
CPU 微架构需要前端和后端之间的紧密协作。 如果前端效率不高,会导致后端执行单元等待新指令,从而产生性能瓶颈。 如果后端效率不高,执行速度太慢,新指令无法进来,也会导致性能瓶颈。
雷达图中也有数值,数字越小,工作负载对这个参数特性的依赖性越小,这意味着CPU的这个参数特性对整体性能的影响越小。
换言之,数字越小表示处理器对该工作负载的效率越高,数字越大表示工作负载对处理器的依赖性越高。
借助此雷达图,CPU 设计人员可以针对实际工作负载进行优化,而不是基于基准测试测试结果。
上图说明了基准测试中的场景,该场景放大了某些参数特征的影响。
例如,我们在这里看到 L3 缓存的值特别高,这会导致后端停顿的值很高。 此时,后端无法再接受新指令,这将造成性能瓶颈。
这张图右侧的三个雷达图显示了 Cassandra、Grovy 和 Nginx,它们在处理实际工作负载时会受到不同参数特征的影响。
可以看出,这些应用同时受到几种不同参数特性的影响。 如果要针对实际工作负载进行优化,则必须找到一种方法来降低这些数字。
例如,gr**iton4 对 gr**iton3 做了什么。
如上图所示,gr**iton4在运行MySQL时多维度下降,性能提升40%。 当然,这也与内存带宽等规格的提升有很大关系。
无论如何,最后的雷达图显示了用于实际工作负载优化的 gr**iton4。
除了规格的提升、实际工作负载的优化、日益复杂的安全威胁外,GR**ITON4 在安全方面也有了新的内容。
GR**iton4不仅继承了上一代处理器的安全特性,还增加了加密的高速硬件接口,以保护数据的安全性和完整性。
同时,gr**iton4 还新增了分支目标识别(bti-branch target identification)功能,可用于确保分支跳转到正确的目的地址,防止恶意软件使用分支中的跳转命令跳转到意图以外的段,从而提高系统的安全性。
与往年一样,新的 GR**ITON4 处理器随附带有处理器的 EC2 主机。
预览版中发布的第一个 EC2 是 R8G,这是一个内存优化实例,其 VCPU 数量和内存容量是上一代 R7G 的三倍。
这使得R8G在高性能数据库、大数据分析等大型数据集场景中更具优势。 R8G 的发布为内存敏感型工作负载提供了更好的性价比和能效。
2024年,亚马逊云科技发布了第一代自研的gr**iton处理器,亚马逊云科技成为首家研发自研通用服务器处理器的云厂商,这也是Arm服务器阵营再次站稳脚跟的里程碑事件。
为了扩大效益,发布了功能更强大的GR**ITON 2,随后GR**ITON 3在性能和能效方面不断提升。
事实上,去年亚马逊云科技还发布了 gr**iton3 的升级版——gr**iton3e,主要优化了浮点运算和向量运算场景下的性能,这些能力只有在高性能计算领域才被更多关注。
现在看来,亚马逊云科技在2024年发布的gr**iton处理器,以及相应的云主机,确实对服务器市场产生了很大的影响。
如今,gr**iton芯片的应用范围已经大大扩展。 这可以从亚马逊云科技 TOP100 客户也在使用 gr**iton 实例这一事实中看出。 例如,SAP 在使用 Gr**Iton 服务后,通过更快的分析速度将成本降低了 35%,并将碳排放量减少了 45%。
5年间推出4代芯片的亚马逊云科技,利用gr**iton为云厂商自研芯片探索了一条发展路径:每一代芯片都带来更高的性能、更丰富的选择、更低的成本,从而满足企业对云上算力性能的无尽需求。
end