首页 › 业界 › 正文

谷歌打磨 Gemini AI 技能：扩充支持文件类型、提高文档洞察力

风君子业界 2024-08-31 62

8 月 31 日消息，谷歌于 8 月 27 日发布博文，宣布旗下 Gemini AI 支持更多类型的文件，通过分析、摘录、洞察文档内容，为用户提供更优质的 AI 服务。

谷歌表示拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户，现在可从 Google Drive 或本地设备上传各种文件到 Gemini（gemini.google.com）：

电子表格：Gemini AI 现在可以处理 CSV、XLSX 和 ODS 等格式的电子表格，使用户能够分析数字数据、跟踪趋势，并从财务模型、销售报告等生成洞察力。
演示文稿：用户现在可以上传 PPTX、PDF 和 KEY 等格式的演示文稿，让 Gemini AI 可以提取要点、总结内容并识别图表和图像等视觉元素。
图像：Gemini AI 现在可以分析 JPEG、PNG 和 GIF 等格式的图像，提取文本、识别对象并为视觉内容提供上下文。
音频：用户现在可以上传 MP3、WAV 和 FLAC 等格式的音频文件，让 Gemini AI 能够转录语音、识别发言人，并总结访谈、播客和讲座中的要点。
视频：Gemini AI 现在可以处理 MP4、MOV 和 AVI 等格式的视频文件，从演示文稿、纪录片和培训视频中提取脚本、识别场景并总结关键事件。

援引新闻稿，Gemini 可以根据用户输入的提示词，更有针对性地分析用户上传文件，总结复杂的主题、识别趋势和洞察力，以及改进写作和文档组织的建议，帮助用户提高理解、研究和写作能力。

宝骏云海 SUV 定档 9 月 10 日上市：可选纯电 / 插混，预售价 12.18 万元起

哪个范围内的光圈值最出片？