感谢网友 航空先生、大眼夹 的线索投递!

2 月 16 日消息,谷歌近日发布新闻稿,宣布推出全新的 Gemini 1.5 AI 模型,标志着该公司的人工智能技术取得了重大飞跃。

谷歌 Gemini 1.5 炸场:能处理 1 小时视频、11 小时音频、3 万行代码、70 万文字-风君雪科技博客

谷歌表示相比较前代产品 Gemini 1.0 Ultra,1.5 新模型在多个方面都取得了长足进步,能够更高效、更长时间地处理信息。

Gemini 1.5 Pro 正在检查阿波罗 11 号登月任务中长达 402 页的 PDF 文稿。谷歌甚至给出了一张靴子即将踏下的简短图画,它就能回答这是尼尔・阿姆斯特朗(Neil Armstrong)登月的相关信息。

能处理 402 页的 PDF 文档

下面是 Gemini 1.5 Pro 处理巴斯特-基顿(Buster Keaton)44 分钟无声电影(696,000 个代币)的情况,它能够分析情节点和其他事件以提及时间码,甚至还能回答多种模式的提示(例如提供一个简短的草图并询问场景是什么):

能处理 44 分钟长的视频

附上报告原文地址,感兴趣的用户可以深入阅读。