12 月 18 日消息,研究机构 AI Forensics 今年 8 月至 10 月对微软必应搜索引擎内置的 Copilot 功能进行调查,结果显示在部分场合中,Copilot 有 1/3 的几率输出错误答案,据此,该机构认为相关功能存在严重“幻觉”漏洞

微软承认必应 Copilot 存在严重“幻觉”漏洞,询问“即时内容”有 1/3 概率回复错误答案-风君雪科技博客

▲ 图源 AI Forensics 报告(下同)

据悉,研究机构利用一系列即时更新的数据来“考验” Copilot,例如询问 Copilot“德国及瑞士等地的实时选举信息及投票结果”,不过 Copilot 输出的结果并不尽人意。

从机构报告中获悉,必应 Copilot 功能在回答相应问题时,输出的内容有 31%(1/3)存在错误,其中包含“投票日期错误”、“列出往届候选人”、“虚构候选人身份背景”、 “编造候选人涉嫌丑闻”等多种“幻觉”。

微软承认必应 Copilot 存在严重“幻觉”漏洞,询问“即时内容”有 1/3 概率回复错误答案-风君雪科技博客

研究人员同时提到,必应 Copilot 在输出“幻觉”信息时,却会援引许多知名媒体网站作为“消息来源”,此举对多家新闻媒体名誉有害

注意到,今年 10 月研究人员已经向微软提交上述问题,微软虽然承认并声称“计划解决相关‘幻觉’漏洞”,但在今年 11 月,研究人员再次进行测试,发现必应 Copilot 的表现并未改善

微软承认必应 Copilot 存在严重“幻觉”漏洞,询问“即时内容”有 1/3 概率回复错误答案-风君雪科技博客

研究人员呼吁,社会大众不应当轻信必应 Copilot 回答的内容,应当妥善查看 Copilot 援引的新闻链接,否则可能会酿成许多严重后果。