超越NVIDIA A100！英国AI公司发布最大7nm芯片：集成594亿个晶体管

总部位于英国的AI芯片公司Graphcore今天发布了第二代IPU GC200，采用台积电7nm工艺，晶体管数量高达594亿个，裸片面积达到823平方毫米。这比两个月前英伟达最新发布的安培架构GPU A100的540亿个晶体管增加了10%，黄仁勋当时说A100是全球最大的7nm芯片，裸片面积为826平方毫米。

IPU是一种全新的大规模并行处理器，雷锋网此前报道，已经推出了基于台积电16nm工艺集成236亿个晶体管的GC2 IPU，120瓦的功耗下有125TFlops的混合精度、300M的SRAM能够把完整的模型放在片内。

第二代IPU GC2000（MK2）与第一代IPU（MK1）相比，实际性能提高了8倍。Graphcore联合创始人兼CEO Nigel Toon表示，GC200是目前世界上最复杂的处理器，可使创新者实现AI的革命性突破。

Mk1 IPU产品与Mk2 IPU产品性能对比

据悉，GC2000芯片内部有1,472个独立的处理器内核，能够执行8,832个独立的并行线程，所有这些均由900MB的RAM支持。

Nigel说：“GC200在处理器内部具有史无前例的900MB超高速SRAM，在每个处理器内核旁边都设有大量RAM，以实现每位最低能量的访问。Graphcore的Poplar软件还允许IPU通过Graphcore独特的Exchange-Memory通信访问Streaming Memory。这甚至可以支持具有数千亿个参数的最大模型。每个IPU-M2000都可以支持密度高达450GB的Exchange-Memory，以及前所未有的180TB/秒的带宽。”

Graphcore IPU-Fabric技术

除此之外，基于最新GC200的一款即插即用的机器智能刀片式计算单元IPU-M2000还集成了Graphcore的专用AI联网IPU-Fabric。新的Graphcore GC4000 IPU-Gateway芯片可以让每个IPU-M2000提供2.8Tbps。Graphcore称，在从数十个IPU扩展到数以万计个IPU的过程中，IPU-Fabric技术使通信时延几乎保持恒定。

据悉，1U大小的IPU-M2000可提供1个PetaFlop的机器智能计算。利用IPU-M2000可构建成IPU-POD64的模块化机架规模解决方案。IPU-M2000的设计使客户可以在IPU-POD配置中构建多达64,000个IPU的数据中心规模系统，提供16ExaFlops的机器智能计算能力。