作者:宪瑞
2006 年 11 月 Intel 公司推出了世界首款 X86 四核处理器,2008 年 Intel 推出了旗下首款 8 核处理器。与以往从单核到双核的过渡相比,4 核到 8 核处理器的过渡用时要长得多,主要原因就在于日常应用的软件及游戏中对多核并不敏感,4 核都不落伍,8 核是锦上添花,但不是雪中送炭。
CPU 核心数变化不大,难道这十多年中计算任务也没有发生改变吗?
非也,不仅变了,而且变化还是很大的,尤其是近两年来人们对 PC 以及数据中心的要求改变了很多:CPU 通用任务性能要强,整合的核显 GPU 要能玩主流游戏,存储速度要快,数据传输速度要高,网络连接速度要快又稳,甚至还要能跑 AI 运算——在这个万物皆可 AI 的时代,AI 性能也是处理器的要求了。
要想适应新时代的计算,就需要新的战略以及全新的产品。
在去年 12 月的架构日会议上,Intel 就提出了新的企业战略,开始向以数据为中心的方向转变,为了继续推动摩尔定律向前发展,Intel 未来将借助指数级思维推动计算创新。
要想实现这个目标,Intel 提出了六大支柱技术,分别是制程与封装、架构、存储、互连、安全、软件,这六个方面扩展现代处理器的内涵,实现了性能、价格与功能的平衡。
首个承载六大技术支柱思想的产品就是 Intel 最近发布的 Ice Lake 十代酷睿处理器,在它身上有先进的 10nm 制程工艺,也有新一代 Sunny Cove CPU 核心,更有性能翻倍的 Gen11 核显,同时还在 AI 加速、雷电3、Wi-Fi 6 等连接技术方面做了创新。
十代酷睿 Ice Lake 之制程:业界最强 10nm 工艺
在 Intel 的六大支柱中,制程工艺是最基础的,也是最核心的,因为它是 Intel 继续推动摩尔定律向前发展的关键。
对半导体芯片来说,升级先进工艺带来的性能、能效好处是多方面的,Intel 的 10nm 节点又是近年来升级最大的一次,实现了每平方毫米 1 亿晶体管的超高密度,是 14nm 节点的 2.7 倍多,这个增幅是高于业界通常 2 倍密度的标准的。
得益于 10nm 工艺的大提升,Ice Lake 处理器的晶体管密度甚至比其他家公司的 7nm 工艺还要高,再加上 Intel 在后端工序制造材料及工艺上的改进,10nm 工艺使得 Ice Lake 处理器在集成度、性能、功耗、发热等方面比某些 7nm 处理器更优秀。
十代酷睿 Ice Lake 之 CPU:全新 SunnyCove 核心
Ice Lake 处理器之所以备受瞩目,就在于它是近年来 Intel 首次同时升级 10nm 先进制程工艺及 CPU 核心架构,使用了 Sunny Cove 微内核。
Sunny Cove 内核架构是 Intel 未来 CPU 架构的第一版,重点强化 ST 单核性能,主要有如下改进:
- 使用了可降低延迟的新算法。
- 增强的微架构,可并行执行更多操作。
- 增加关键缓冲区和缓存的大小,可优化以数据为中心的工作负载。
- 针对特定用例和算法的架构扩展。增加了关于加密性能的新的指令集,如矢量 AES 和 SHA-NI。在今天的演示中,Sunny Cove 因为有新的指令集7-zip 性能提升了 75%。
体现到具体应用中,那就是 Sunny Cove 架构大幅提升了日常应用的 IPC 性能,多则 40%,平均下来提升了 18%,这是近年来 CPU 架构史上 IPC 增幅最高的一次。
十代酷睿 Ice Lake 之 GPU:核显可以玩 1080p60fps 游戏
在 CPU 架构之外,Ice Lake 处理器还大幅改进了 GPU 核心,这次使用了全新的 Gen11 核显,最多拥有 64 组 EU 单元,FP32 浮点性能提升到了 1TFLOPS 以上,FP16 浮点性能高达 2TFLOPS 以上,堪称史上最强核显。
TFLOPS 以上的性能使得核显 GPU 已经具备了可观的游戏性能,实测显示 48/64 单元的 Iris Plus 核显可以保证多数游戏大作在 1080p 分辨率的平均帧率超过 30FPS,部分还能突破 60FPS。
除了游戏性能大幅提升之外,Intel 还加强了与游戏厂商的合作,并推出了全新的驱动程序 UI,特别针对游戏玩家提供了丰富的功能及优化,能自动检测硬件、设定最佳可玩性配置,支持 44 款游戏一键优化,未来会超过 400 款游戏支持。
十代酷睿 Ice Lake 之 AI:专用指令集实现 2.5 倍 AI 性能
AI 是近两年来的一大热点,也是未来最有前途的先进之一。AI 不同于普通的 CPU 运算,为此 Intel 在 Ice Lake 处理器中加入了专用的深度学习指令集——DL Boost,原本这是用于数据中心处理器的功能,现在下放给普通处理器了。
DL Boost 是一组深度学习(Deep Learning)指令集的组合,可以用它来加速自动图像增强、图像检索、媒体后处理和其他 AI 任务。
此外,DL Boost 指令集还配置了 GNA 专用引擎和 Dynamic Tuning 2.0,其中 GNA 引擎可以帮助处理器以极低的功耗运行语音处理、噪声抑制等后台工作负载,从而最大限度地延长电池续航时间。
至于 Dynamic Tuning 2.0,它就是用机器学习在 CPU 中的具体应用了,可以实现 Turbo Boost 预测负载并调整功耗。
具体到性能上,专用 AI 指令集使得 Ice Lake 的 AI 性能相比前代处理器有了大幅提升,在 INT8 相关的性能测试中实现了 100% 到 150% 的性能提升,这可比 CPU 通用性能提升的幅度高太多了。
十代酷睿 Ice Lake 之雷电3:40Gbps 全功能接口
随着计算任务的日趋复杂,涉及到的数据存储也会越来越多,特别是内容创作领域,4K 甚至逐渐爆发的 8K 内容生态对数据交换速度提出了更高挑战,而 Ice Lake 处理器集成了雷电 3 技术,速率可达 40Gbps。
在 Ice Lake 之前就有了雷电3,但彼时的雷电 3 还需要独立的主控芯片,成本高,接受范围也小,但 Ice Lake 处理器首次集成了雷电 3 主控,不再需要独立的芯片,降低了 Ice Lake 平台的成本,减少了设计的复杂性。
至于性能,雷电 3 不会让人失望,目前最快的 40Gbps 接口速率,折合 5GB/s的带宽,只有 PCIe 4.0 技术的 SSD 才有可能与之一战。此外,雷电 3 还是未来 USB4 技术的基础,物理接口都是 Type-C,二者是统一兼容的。
十代酷睿 Ice Lake 之 Wi-Fi 6:首次集成千兆 Wi-Fi 网络
有了雷电 3 在有线传输上的进步,Ice Lake 还在无线网络上实现了一次突破,支持 Wi-Fi 6 无线技术,这是业界首次集成千兆 Wi-Fi 网络。
虽然 Wi-Fi 6 标准市以后的,但是不代表每家的 Wi-Fi 6 速度就是一样的,Ice Lake 的 Wi-Fi 6 解决方案支持了 160MHz 通道带宽,支持 2×2 MIMO,理论速度可达 2402Mbps,是其他 Wi-Fi 理论速度的2-4 倍,延迟比其他 Wi-Fi 6 减少了 75%,比标准速度要快 40% 以上。
总之,对十代酷睿 Ice Lake 处理器来说,它既是 Intel 对以往工艺、架构的告别,也是 Intel 全新指数级思维的开始,在制程工艺、架构、存储、互联、安全及软件方面做出了突破。
对普通消费者来说,先进的 10nm 工艺、高性能 Sunny Cove CPU 核心、可玩主流游戏的 Gen11 出现、2.5 倍性能的 AI 加速、40Gbps 的雷电3、千兆级的 Wi-Fi 6 无线等六大优点使得 Ice Lake 成为最受期待的新一代处理器,我们等这一天太久了。
最新评论