2022年3月的GTC技术大会上,NVIDIA正式发布了,同时打造了两颗超级芯片,一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一。

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心-风君雪科技博客
Grace CPU二合一

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心-风君雪科技博客
Grace CPU+Hopper GPU二合一

现在,NVIDIA官方详细揭示了Grace Superchip超级芯片的设计与性能、能效

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心-风君雪科技博客

Grace CPU基于Armv9-A 9.0架构、Neoverse V2 64位内核,以4个128-bit功能单元的方式配置了两组SIMD矢量指令集,一是SVE 2(缩放矢量扩展第二版),二是NEON(高级SIMD)。

它还支持LSE(大型系统扩展),可提供低成本的原子操作,改进CPU通信吞吐。

NVIDIA声称,这种核心的能效,是如今服务器常见x86核心的2倍。

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心-风君雪科技博客

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心-风君雪科技博客

,互相通过3.2TB/s超高带宽的NVIDIA缩放一致性Fabric总线互连,而二合一的超级芯片上就是144个核心。

每核心64KB一级指令缓存、64KB一级数据缓存、1MB二级缓存,一颗超级芯片的所有核心共享234MB三级缓存。

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心-风君雪科技博客

内存整合封装了LPDDR5X,最大容量960GB,最高带宽1TB/s(每一颗500GB/s),还支持ECC。

对比传统的八通道DDR5,这种设计不但带宽高出53%,单位功耗也只有1/8。

对比海量带宽的HBM2e,单位成本只有1/3,容量则可达8倍。

扩展支持八组PCIe 5.0 x16,总带宽1TB/s,还有用于管理的低速PCIe通道。

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心-风君雪科技博客

性能方面,一颗超级芯片的FP64双精度峰值浮点性能可达7.1TFlops(每秒7.1万亿次计算),热设计功耗500W。

当然,AMD已经有了Zen4架构、最多96核心的霄龙9004系列,NVIDIA Grace依然还没有商用。

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心-风君雪科技博客

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心-风君雪科技博客