12 月 14 日消息,开发人员 Oliver Wehrens 近日测试了苹果 M1 Pro、M2 Ultra 和 M3 Max 三款 Apple Silicon 芯片升级 MLX 框架后训练 AI 能力,并对比了英伟达的 RTX 4090 显卡。

10 分钟 Whisper 模型处理测试:英伟达 RTX 4090 比苹果 M3 Max 慢 86%-风君雪科技博客

Wehrens 使用 OpenAI 的语音识别模型 Whisper 进行测试,主要测量转录 10 分钟音频文件所需时间。

测试结果显示 M1 Pro 处理音频时间需要 216 秒,英伟达 RTX 4090 显卡处理时间需要 186 秒。

而具有 76 个 GPU 的 M2 Ultra 和具有 40 个 GPU 的 M3 Max 处理性能更为优秀,分别为 95 秒和 100 秒。

此外苹果 Apple Silicon 芯片功耗也更为优秀。英伟达 RTX 4090 在运行状态下,比闲置状态下高出 242W。

而配备 M1 Pro 芯片在运行状态下,仅比闲置状态下高出 38W。

此前报道,MLX 框架特点如下:

  • 熟悉的 API:Python 和 C++ API 具有熟悉的框架,如 NumPy 和 PyTorch,使经验丰富的研究人员易于学习。

  • 轻松高效:MLX 使用可组合的功能转换来优化 Apple Silicon 的性能。

  • 延迟计算:能够防止不必要的计算并提高资源效率。

  • 动态设计:能够适应输入形状变化,简化了调试和测试过程。

  • 软硬结合:MLX 无缝利用苹果设备的 CPU 和 GPU,确保用户能够充分利用硬件。

  • 统一内存优势: MLX 利用苹果统一内存,能够进一步加强数据移动速度

  • 研究人员友好:MLX 专为研究人员设计。

相关阅读:

《苹果推出 MLX 深度学习框架:专为 Apple Silicon 优化,可实现“软硬结合”》