定义AI时代的基础设施,百度阳泉云计算中心撑起百度AI野心-风君雪科技博客

  产业智能化已是大势所趋。随着“智能+”上升为国家战略,各行业都在掀起运用 AI 技术进行创发展的热潮。这背后体现着 AI 技术的进步,特别是算力、算法、数据三大基础要素的飞速发展。而这也对 AI 时代的技术底座——IT 基础设施建设提出了更高的要求,时常被忽略的数据中心实力将成为技术提供者的核心竞争力。

  AI 时代的基础设施应该是怎样?亚洲单体规模最大、技术最先进的数据中心——百度阳泉云计算中心或将为此定义。4 月 8 日,百度的一场“云上百度 AI 技术硬核揭秘之旅”为大家揭开了神秘面纱。

定义AI时代的基础设施,百度阳泉云计算中心撑起百度AI野心-风君雪科技博客

百度阳泉云计算中心监控中心

  从“最硬核”的数字维度整体来看,百度阳泉云计算中心创新“亮点”颇多:已上线服务器超过 15 万台、年均 PUE 低至 1.09、超过 300 万个 CPU 核、存储容量超过了 6EB……作为百度自建的第一个超大规模数据中心项目,百度阳泉云计算中心规划建筑面积超过 20 万平米,按照 T3+ 标准设计,服务器装机能力超过 28 万台,在数据存储规模、计算能力和环保节能三方面都处于亚洲领先水平。目前,该中心已建成投产 12 万平方米,采用了百度 400 多项数据中心、网络及服务器专利技术。

  针对云计算中心而言,绿色环保是永恒的话题。百度在最初数据中心设计和运营时,倡导绿色环保理念,积极践行社会责任,关注节能减排,在绿色环保方面走在社会前列的,PUE 值是最有力的体现。2018 年,百度阳泉云计算中心年均 PUE(电力使用效率,即数据中心总能耗与 IT 能耗之比。PUE 值越接近于1,表示效率越高。)突破了 1.10,达到 1.09,能源效率国内第一,比全国数据中心平均 1.73 在基础设施能效方面提升了 88%,达到国际领先水平。目前,该数据中心每年可节电量可达 2.5 亿度,相当于 13 万户居民一年的用电量。

定义AI时代的基础设施,百度阳泉云计算中心撑起百度AI野心-风君雪科技博客

AI 计算集群

  在数据存储规模方面,作为亚洲单体最强大的算力平台,该中心拥有超过 300 万颗 CPU 核、6EB 级存储容量,可存储的信息量相当于 30 多万个中国国家图书馆的藏书总量。

  阳泉云计算中心从设计之初,就有行业领先的构思未雨绸缪。2012 年开始规划设计时,决定取消架空地板的设计,全部按照整机柜交付模式设计,从卸货平台、走廊、电梯到机房全程实现无障碍交付设计,阳泉云计算中心的服务器,全部是以整机柜服务器方式设计制造的。换言之,在服务器厂家出厂的时候,服务器机柜里已经安装部署满了服务器节点。这意味着,百度无需像其他云计算厂商那样,一台服务器一台服务器地在现场安装,而是把整个机柜直接推进去就可以进行测试上线。这甚至为多年之后的工作都节省了人力、提供了便利。

定义AI时代的基础设施,百度阳泉云计算中心撑起百度AI野心-风君雪科技博客

天蝎整机柜服务器

  除了云计算厂商常规的存储等服务外,AI 时代,越来越多的企业将会智能化升级,更多的复杂的生产环节需要数字化,这对于云计算中心则提出了更高的要求,需要更强的计算能力,以及能够提供针对性的定制化解决方案。

  百度阳泉云计算中心可以为百度智能云、百度 App、百度地图、智能城市、小度、Apollo 等百度内外部的产品和厂商提供强劲的计算能力。2018 年 1 月该中心第 10 万台服务器上线了,成为国内首个单体规模突破 10 万台的数据中心,目前已上线服务器超过 15 万台。包括了天蝎整机柜服务器、“冰山”冷存储服务器、X-MAN 超级 AI 计算平台等多种百度自研计算系统。其中,2017 年上线的X-MAN 2.0,是国内首个采用液体冷却技术的 GPU 解决方案,实现了超高的散热效率,规模应用后,可以全面去除制冷机组,全面实现无冷机运行。

  百度阳泉云计算中心使用百度自主研发高性能交换机,提供超大规模的网络吞吐,支持 10G、25G 的通用计算网络接入和 100G 的 AI 高速无损网络互联技术。在数据中心外部,百度网络构建了三个时延圈:从数据中心覆盖用户时延不超过 30ms,从 POP 点覆盖用户的时延不超过 10ms,从 CDN 覆盖用户的时延不超过 2ms,确保全国用户的全面覆盖和就近接入。在数据中心内部,百度通过大带宽、低时延、无损网络,把数据中心数十万台服务器连接成为一个超级计算机,成为 AI 时代云上百度最强大的技术硬核。

定义AI时代的基础设施,百度阳泉云计算中心撑起百度AI野心-风君雪科技博客

百度系统部总监张炳华

  现场,百度系统部总监张炳华分享到,百度在云计算、大数据及人工智能领域拥有行业领先的技术优势,百度拥有的多个超大规模的数据中心、数十万台服务器、超大规模 GPU 集群,通过网络高速互联构成了强大的算力平台,定义了 AI 时代的基础设施标准,并为百度 AI 技术多年积累和业务实践的集大成——百度大脑提供了强大的算力平台。而算力平台之上的百度大脑,则为百度的 AI 业务提供了强有力的算法和数据支持。

定义AI时代的基础设施,百度阳泉云计算中心撑起百度AI野心-风君雪科技博客

百度智能云产业智能化业务负责人李硕

  百度智能云产业智能化业务负责人李硕介绍,在超强算力的支持下,作为百度决胜 AI 时代重要组成部分的百度智能云,一方面为百度自身业务提供了强大的智能云计算服务,承载了多款用户量过亿的产品、服务和解决方案,如搜索、信息流、视频流、百度地图和智慧城市、小度、Apollo 等。同时,百度智能云也正在向各行业伙伴提供全栈 ABC+IoT 产品与解决方案。目前,百度实现了在互联网,媒体,娱乐,金融,教育,交通,安防和应急管理,能源等多个重要产业的智能化立体布局,为社会各行业提供最领先的云计算,最开放和安全的大数据和最落地的人工智能解决方案。

  在刚刚过去不久的百度与央视 2019 年春晚红包互动期间,全球观众互动次数达到 208 亿次,春晚数据流量为每秒峰值 5000 万次,每分钟峰值 10 亿次。在包括阳泉云计算中心在内的百度数据中心的强有力支持下,百度成为扛住春晚流量的第一家互联网公司。百度阳泉云计算中,也已成为百度夯实 AI 技术基础、推动 AI 商业化落地的底座和技术载体,更将是百度定义 AI 时代技术基础设施、落地“夯实移动基础、决胜 AI 时代”核心战略的自信和底气所在。在未来,以云计算中心为代表的“硬核”实体基础设施,保障大型活动的“背后功臣”,相信会受到行业更多的关注。