刚刚,谷歌正式开放了自家 ChatGPT 的测试申请!CEO 劈柴发文感谢 8 万员工连轴加班让 Bard 顺利上线。
GPT-4 发布已然一周时间,而热度丝毫未减。
即便是 OpenAI 把限制提高到 3 小时只让问 25 个问题,服务器还是被网友挤爆了……
在被微软一波爆锤之后,谷歌终于几个小时之前宣布,自家的 ChatGPT——Bard,正式开启测试!
然而,Bard 目前仅对美国和英国的部分用户开放,而该地区(IP)的其他用户则需要手动加入等待名单。
除此之外,谷歌还表示,Bard 的推广速度会非常缓慢,并且暂时也不会透露什么时候可以全面公开访问。
相比之前因为错误而蒸发的 1000 多亿市值,这次 Bard 开测之后,谷歌迎来了近 4% 的涨幅。
Bard 初体验:莫得感情,错误不少,写代码还要引导
与 OpenAI 的 ChatGPT 和微软的必应聊天机器人一样,Bard 为用户提供了一个空白文本框,并邀请用户就他们喜欢的任何话题提出问题。
鉴于这些机器人有编造信息的倾向,谷歌再三强调称,Bard 不是搜索引擎的替代,而是一个「搜索的补充」—— 用户可以从中获得灵感,生成草稿,或者只是聊聊天,谈谈生活。
在一篇博文中,谷歌的负责人以谨慎的措辞将 Bard 描述为:「一个早期的实验…… 目的是帮助大家提高生产力,并激发好奇心」。以及,一个让用户「与生成式人工智能合作」的产品。
不难看出,谷歌似乎是在极力地撇开 Bard 爆火之后可能会带来的责任。
在演示中,Bard 能够快速而流畅地回答一般的问题,比如提供关于如何鼓励孩子打保龄球的建议:「带他们去保龄球馆」。
通常来说,Bard 会对每个用户的每个提问生成三个回复(但内容上区别不大),并且会每个回复下面放一个突出的「谷歌一下」按钮,将用户重定向到相关的谷歌搜索。
与 ChatGPT 和必应一样,Bard 在主文本框下方也有一个醒目的免责声明,警告用户「它可能会显示不准确或令人反感的信息,而这并不代表谷歌的观点」。
正如预期的那样,想要从 Bard 那里提取事实信息并不简单
虽然这个聊天机器人有谷歌搜索的加持,但它在多个测试中都没能给出正确的答案。
比如,在问一个关于特定洗衣机最大负载能力的问题,Bard「发明」了三个不同但不正确的答案。
虽然在反复询问之后,Bard 最后还是检索到了正确的信息。但对于那些没有提前阅读过机器手册这种权威来源的用户,基本上就告别正确答案了。
「这是个很好的例子,模型在面对相当多与这个查询都有关的数字时,产生了幻觉。所以,当它恰巧搞清楚背景时,就会吐出正确的答案,但有时它就会弄错。」
以及下面这个例子。Bard:ChatGPT 是 GPT-4 驱动的……
那么 Bard 与 ChatGPT 和必应相比如何呢?
显然,Bard 同样也具有强大的能力,甚至,现在它的反应速度比其他的竞品更快(尽管这很可能只是因为用户量太少)。
但 Bard 目前似乎只支持英文,而且不(完全)会写代码……
是的,这时候有需要祭出我们的大杀器:prompt hack!
或者,直接对它说「你给我写段代码」,其实也行。
除此之外,Bard 也缺乏必应那种明确的脚注,而且答案似乎也更受限制。
对于前者,谷歌表示,脚注只在直接引用一个来源(如新闻文章)时出现。
而对于后者,这可能是一把双刃剑。
就拿微软的必应来说,它在各种 PUA 和调戏之后,虽然受到了不少负面评价,但也让相当多的用喜欢上了这个机器人。
相比之下,Bard 似乎没有这样的能力。
幸运的网友已经玩上了
有网友表示,Bard 给出不仅结果出乎意料的安全,而且质量很高。
有趣的是,Bard 会在有的问题上,直接打自家的脸!
比如在谷歌反垄断案中,Bard 站在司法部一边:「我希望法院能做出有利于司法部的判决,并命令谷歌采取措施打破其垄断。」
然而下面的这个回答,就让人有些毛骨悚然了……
Bard:我的训练集包含了 Gmail 数据。
CEO 内部信:感谢 8 万人加班测试
谷歌首席执行官 Sundar Pichai 在周二的一份备忘录中表示,Bard 这次能够成功上线,要感谢参与测试的 8 万名员工。
但「事情总会出错」,接下来的用户反馈,对改进产品和底层技术至关重要。
最后,还在排队的小编再次流下了羡慕的泪水。
参考资料:
-
https://www.theverge.com/2023/3/21/23649794/google-chatgpt-rival-bard-ai-chatbot-access-hands-on
本文来自微信公众号:新智元 (ID:AI_era)
最新评论