如果说GPU是AI时代的加速器,那么CPU依然是整个数字世界的基石。
如今,数字世界的基石因为ARM处理器的崛起而愈发光彩。在今天的亚马逊云科技re:Invent 2025大会上,亚马逊云科技正式推出Graviton 5处理器。Graviton 5采用 192 核设计和3nm制程工艺,面向通用、计算密集型和内存密集型工作负载,性能比上一代产品提升高达 25%。
此外,根据亚马逊云科技数据,连续第三年新增 CPU 容量中一半以上由 Graviton 提供支持,排名前 1000 的 EC2 客户中有 98%采用Graviton架构。

无疑,Graviton 5的发布无疑具有标志性的产业意义。它不仅意味着亚马逊云科技自研芯片每两年一周期的成功,更标志着数据中心算力结构发生了根本性转变。
Graviton 5:性能再大幅提升
Graviton5 是亚马逊云科技迄今为止最为先进的自研定制CPU。
据悉,Graviton5 采用 3nm 工艺和裸芯片散热设计,在降低热阻和风扇功耗的同时兼顾性能和能效。Graviton5 主要面向通用、计算密集型和内存密集型等工作负载。
与上一代产品相比,基于全新 Graviton5的 M9g 实例的计算性能提升25%。Graviton5的L3 缓存容量提升 5 倍,每个核心的缓存容量比 Graviton4 提升 2.6 倍,内存速度更快。同时,实例的网络吞吐量提升高达 15%,且在最大实例规格上,网络带宽翻倍。

亚马逊云科技副总裁、杰出工程师Ali Saidi介绍,Graviton5 覆盖了多种工作负载,为用户带来了极具性价比的服务。
同时,全新第六代 Nitro系统和 Nitro 隔离引擎,进一步提升Graviton 5的安全保障。 Nitro系统能虚拟化、存储和网络任务卸载到专用硬件上。Graviton5 引入Nitro 隔离引擎,通过使用形式化验证来增强 Nitro 系统,从而确保工作负载彼此隔离和安全。全新Nitro隔离引擎使用精简且经过形式化验证的代码库,其中包含数学证明,以确保其行为完全符合定义。亚马逊云科技表示,这项技术为经数学验证的云安全树立了新的标准。
根据亚马逊云科技介绍,基于Graviton5 的M9g 专为通用云工作负载而设计,预览版现已推出;面向计算密集型工作负载的 C9g 实例和面向内存密集型工作负载的 R9g 实例计划于 2026 年推出。
Ali Saidi认为Graviton每两年一个版本的节奏,保证了每个版本的显著增强,比较符合用户的预期和实际需求。
通用算力芯片在AI时代依然大有作为
在生成式AI爆发的初期,通用算力与AI算力往往被视为两种独立的资源,并且AI算力备受关注。Omdia最新《云与数据中心AI处理器预测报告》显示,2024年GPU和AI加速器出货金额达1230亿美元,预计到2030年将达2860亿美元。
可以说,AI算力未来市场空间未来大巨大。但这是否意味着通用算力就此沉寂?
如今,随着AI推理走向工业化、AI Agent大量涌现以及大量应用进行AI化改造,算力需求也在发生悄然变化。通用算力与AI算力不再是非此即彼和各自为战;相反,通用算力与AI算力正全面走向深度融合与协同。
例如,在GPU等AI算力资源极其昂贵的背景下,通用CPU通过集成更多AI加速单元,用于处理中小规模的推理任务(Inference)。像亚马逊云科技Graviton就是目前市场的典型,通过增加BF16指令集支持,达到优化机器学习推理的目的。
亚马逊云科技副总裁、杰出工程师Ali Saidi认为,AI的快速发展,其实为通用计算带来了更多机会,不仅大模型的构建、测试、部署和学习需要CPU参与,AI还会带来更多软件需求,进而带动通用算力的需求。
事实上,从亚马逊云科技的芯片战略也能看出通用算力与AI算力融合的重要趋势。以今年大会上正式发布上市的Trn3 UltraServer为例,其计算节点采用All AWS Sillicon的策略,将Graviton+Nitro+Trainium4芯片进行垂直整合,相比上一代,整体计算性能提升4.4倍。

具体来看,在Trn3 UltraServer中,Graviton用来处理IO任务,Nitro则提供极速网络联接,支持数量巨大的Trainium 3进行内存共享。
毫无疑问,作为云服务一哥,亚马逊云科技深知要想在AI时代实现更低成本和更高性能,就必须将通用算力与AI算力进行协同融合,以达到整个算力服务的最佳。
根本性改变算力结构
过去十年,数据中心算力结构发生了根本性改变。
在Graviton出现之前,数据中心通用处理器是X86的天下。虽然也有像高通等厂商想推动ARM处理器进入到数据中心市场,但无不以失败告终。
这十年所发生的巨大变化,要源自于亚马逊在2015年以3.5亿美元收购以色列芯片设计公司 Annapurna Labs。
2018年,亚马逊云科技发布Graviton 1,并退出基于Graviton 1的EC2 A1计算实例,正式宣告开启对数据中心算力结构的破局。Graviton 1的产业意义证明,Arm处理器在云端运行的可行性。
2019年12月,基于Arm Neoverse N1核心和采用7nm制程工艺的Graviton 2发布,其性能相比于上一代有着多大7倍的提升,标志着Arm处理器开启全面可用的阶段,不仅仅适用于Web服务、数据库、缓存等核心业务同样胜任;
2021年11月,采用5nm制程工艺和Chiplet设计的Graviton 3正式问世,Graviton 3成为首个支持DDR 5内存的云端处理器,内存带宽提升50%,浮点运算性能翻倍,专门对机器学习等工作负载优化。
2023年11月,基于Arm Neoverse V2核心和采用4nm制程工艺的Graviton 4接踵而至,采用96个核心设计,内存带宽提升75%,优化高性能数据库、AI数据处理等工作负载。
再到今年大会上,Graviton 5的正式发布,性能得到持续提升。根据亚马逊云科技数据显示,其数据中心超过 50% 的 CPU 新增容量都部署在 Graviton 上。
事实上,Graviton的推出堪称云计算和半导体产业发展的一个分水岭事件。亚马逊云科技用五代Graviton芯片证明了“云服务商自研芯片”的商业闭环的成功,它不仅打破了x86架构在数据中心服务器市场的长期垄断,更开启了云服务商“自研芯片”的时代。
此后,全球四大云服务商全部布局和推动自研芯片,进而导致数据中心算力结构在过去十年发生根本性变化。
