IT 之家 1 月 18 日消息,谷歌 DeepMind 近日在《Nature》上发表论文,展示了最新 AI 系统 AlphaGeometry,解决数学几何问题的能力媲美全球顶尖学生。
AlphaGeometry 在高中生国际数学奥林匹克竞赛(IMO)中,30 道题目中正确回答 25 道,正确率为 83%。
作为对比,人类金牌得主平均能正确回答 25.9 个问题,而此前 AI 模型的最好纪录是成功回答 10 道几何问题。
这一成绩非常接近人类参赛者的金牌标准,Deepmind 认为,这凸显了人工智能在数学领域日益增长的能力。
参与该项目的 Deepmind 研究员 Quoc V Le 告诉《金融时报》,新系统是向构建人工通用智能(AGI)迈出的关键一步。
AlphaGeometry 是一种结合了语言学习和演绎推理的神经符号系统。该系统结合神经语言模型的预测能力与基于规则的演绎引擎,共同寻找解决方案。
语言模型是一种解决方案助手,当符号引擎无法独立找到解决方案时,它就会向符号引擎建议新的方法。
谷歌 Deepmind 将这种方法比作心理学家丹尼尔-卡尼曼(Daniel Kahneman)所说的 “快思慢虑”,结合快速模式识别能力与逻辑推理的深思熟虑。
AlphaGeometry 通过从形状和线条中随机生成几何图形来创建训练数据。然后,系统会识别并重建这些图表中的所有连接、关系和证明。通过这一过程,AlphaGeometry 无需依赖人工演示或指导,就可以学习和理解几何图形。
Deepmind 称这种技术为“符号演绎和回溯”(symbolic deduction and traceback),解决了数学中训练数据太少的问题。
完成后的数据集由十亿个随机的、独一无二的几何物体图组成,每个图中的点和线之间的所有关系都是“详尽推导”出来的。
IT 之家附上 AlphaGeometry 源代码和论文地址如下
-
Trinh, T.H., Wu, Y., Le, Q.V. et al. Solving olympiad geometry without human demonstrations. Nature 625, 476–482 (2024).
https://doi.org/10.1038/s41586-023-06747-5 -
AlphaGeometry Github 源代码
最新评论