迈向通用 AI 关键一步，谷歌 AlphaGeometry 国际奥数正确率达 83%

IT 之家 1 月 18 日消息，谷歌 DeepMind 近日在《Nature》上发表论文，展示了最新 AI 系统 AlphaGeometry，解决数学几何问题的能力媲美全球顶尖学生。

AlphaGeometry 在高中生国际数学奥林匹克竞赛（IMO）中，30 道题目中正确回答 25 道，正确率为 83%。

作为对比，人类金牌得主平均能正确回答 25.9 个问题，而此前 AI 模型的最好纪录是成功回答 10 道几何问题。

这一成绩非常接近人类参赛者的金牌标准，Deepmind 认为，这凸显了人工智能在数学领域日益增长的能力。

参与该项目的 Deepmind 研究员 Quoc V Le 告诉《金融时报》，新系统是向构建人工通用智能（AGI）迈出的关键一步。

AlphaGeometry 是一种结合了语言学习和演绎推理的神经符号系统。该系统结合神经语言模型的预测能力与基于规则的演绎引擎，共同寻找解决方案。

语言模型是一种解决方案助手，当符号引擎无法独立找到解决方案时，它就会向符号引擎建议新的方法。

谷歌 Deepmind 将这种方法比作心理学家丹尼尔-卡尼曼（Daniel Kahneman）所说的 “快思慢虑”，结合快速模式识别能力与逻辑推理的深思熟虑。

AlphaGeometry 通过从形状和线条中随机生成几何图形来创建训练数据。然后，系统会识别并重建这些图表中的所有连接、关系和证明。通过这一过程，AlphaGeometry 无需依赖人工演示或指导，就可以学习和理解几何图形。

Deepmind 称这种技术为“符号演绎和回溯”（symbolic deduction and traceback），解决了数学中训练数据太少的问题。

完成后的数据集由十亿个随机的、独一无二的几何物体图组成，每个图中的点和线之间的所有关系都是“详尽推导”出来的。

IT 之家附上 AlphaGeometry 源代码和论文地址如下

Trinh, T.H., Wu, Y., Le, Q.V. et al. Solving olympiad geometry without human demonstrations. Nature 625, 476–482 (2024).
https://doi.org/10.1038/s41586-023-06747-5
AlphaGeometry Github 源代码