11 月 9 日消息,英伟达今天发布新闻稿,表示旗下的 H100 GPU 在 MLPerf 基准测试中创造了 6 项新记录。

3.9 分钟训完 GPT-3,英伟达 H100 再次刷新 MLPerf 六项纪录-风君雪科技博客

今年 6 月报道,3584 个 H100 GPU 群在短短 11 分钟内完成了基于 GPT-3 的大规模基准测试。

MLPerf LLM 基准测试是基于 OpenAI 的 GPT-3 模型进行的,包含 1750 亿个参数。

Lambda Labs 估计,训练这样一个大模型需要大约 3.14E23 FLOPS 的计算量。

3.9 分钟训完 GPT-3,英伟达 H100 再次刷新 MLPerf 六项纪录-风君雪科技博客

3.9 分钟训完 GPT-3,英伟达 H100 再次刷新 MLPerf 六项纪录-风君雪科技博客

3.9 分钟训完 GPT-3,英伟达 H100 再次刷新 MLPerf 六项纪录-风君雪科技博客

英伟达最新的 Eos AI 超级计算机配备了 10752 个 H100 Tensor Core GPU 和 NVIDIA 的 Quantum-2 InfiniBand 网络,训练完 GPT-3 仅仅只需要 3.9 分钟,比 6 月的测试结果整整快了 7 分钟。

英伟达在帖中,的另一项创纪录的成就是在“系统扩展”方面取得的进步,通过各种软件优化,效率提高到了 93%。

3.9 分钟训完 GPT-3,英伟达 H100 再次刷新 MLPerf 六项纪录-风君雪科技博客

高效扩展在行业中非常重要,因为实现高计算能力需要使用更多的硬件资源,如果没有足够的软件支持,系统的效率会受到大幅影响。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。