作者|闫妍

出品|网易科技《态℃》栏目

今日凌晨,百度、百川智能等8家国产大模型通过首批备案,可面向全社会开放。

具体的企业机构包括:五家北京企业机构,百度(文心一言)、抖音(云雀大模型)、智谱AI(GLM大模型)、中科院(紫东太初大模型)、百川智能(百川大模型)。以及三家上海企业机构,商汤(日日新大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型)。阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中。

产品获批后,8月30日晚23点前后,文心一言的APP已经能公开使用,此前则需要排队领取内测资格。随后,王小川的百川智能和商汤日日新大模型旗下自然语言应用“商量SenseChat”也宣布向全社会全面开放,有信心拿出强有力的大模型产品,接受C端消费者的“用脚投票”。

今年年初,由现象级产品ChatGPT引发的AIGC浪潮,让人们看到了人工智能技术给千行百业带来的巨大的革新潜力,尤其是通用大模型这个万亿赛道,被认为是最值得长期深耕的赛道。

半年多时间,国产ChatGPT之争,历史被一次次刷新。

政策层面,4月11日,国家互联网信息办公室发布的关于《生成式人工智能服务管理办法(征求意见稿)》提出。8月15日,《生成式人工智能服务管理暂行办法》正式施行,这也是我国首个针对生成式人工智能产业的规范性政策,大力支持国产大模型为代表的人工智能产业的发展。

技术层面,国内过去在移动互联网时代所积累的云计算、数据中心、算力中心等领先全球的数字化基础设施,为AIGC的落地运行提供了坚实基础。在中国,互联网科技公司迅速点燃了“百模大战”的硝烟,对于大模型和生成式AI的技术突破,近乎达到了白热化的程度。

AI赛道风云再起,谁将抓住下一个时代?中国版OpenAI,又将花落谁家

李彦宏、王小川交手二十年再度重相逢

面对AIGC巨浪,李彦宏和王小川两位大佬都展现了非凡的行动力。

在国内互联网大厂中,百度今年3月率先推出文心一言并开启邀测。当时,李彦宏就表示,生成式AI代表着新的技术范式,是任何企业都不应错过的大机会。

百度方面曾表示,近十年,百度累计研发投入超1400亿元,是应用、模型、框架、芯片四层全栈布局的AI公司,并在各个层面都有关键自研技术。2022年百度核心研发费用214.16亿元,占百度核心收入比例达到22.4%。李彦宏在近日的电话财报会上还谈到,年底将推文心大模型4.0版。

据了解,百度智能云已经和300多个合作伙伴,在400多个具体的场景中取得测试效果。同时,百度文心大模型已拥有规模庞大的产业落地合作伙伴,覆盖政务、互联网、能源电力、汽车、消费电子、金融、教育、办公等众多重点行业。

这次与文心一言同时获批上线的,还有李彦宏20年的老对手王小川。在搜索引擎、输入法、浏览器等领域交手多番后,双方于2023年重逢大模型新战场。

百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI人才组成。

王小川曾向网易科技《态℃》栏目等媒体表示,百模大战下,一起起步的公司动辄5亿美金估值,第二轮可能就是10亿美金的状态,这个竞争不是“小清新”状态,而是要迅速投入到这场大战役之中。“更多的大厂、更多的钱、更多人、更多的算力互相卷,这种情况下要迅速形成战斗力,因此优先把搜狗的老班底拉起来,大家能迅速磨合,才能适应这么大的挑战。”

成立仅四个月,百川智能便相继发布了三款通用大语言模型。此前6月和7月,先后发布了70亿参数的 baichuan-7B和130亿参数的 baichuan-13B 后,在8月8日发布了530亿参数的大模型 baichuan-53B。

王小川谈到,中国谁做了最好的大模型,还没有结论。“我们跟美国不太一样,美国通用大模型闭源模型头部几家已经定下来了,OpenAI的ChatGPT有了,Google有一张门票,在美国做通用大模型已经没有悬念,投资也不会再去投。但是在中国不是,中国谁做出了最好的大模型并没有结论,大家都在争取的机会,且不一定落在大厂里面。”

在他看来,历史上每次发生大的变化,都有创业公司的机会。创业公司会比大公司跑得快,为什么会不行?

大模型能力谁优谁劣众说纷纭

伴随AI产业的火爆,国内AI相关模型、产品、平台不断涌现,据公开资料显示,国内市场在半年时间里已发布近百个AI大模型,共同掀起一场“百模大战”,但大模型能力谁优谁劣,各项评估报告给出的结果众说纷纭。

近期,IDC发布的《AI大模型技术能力评估报告,2023》,尝试为这个问题找到一些解决方案。该报告创建了一个AI大模型技术能力的评估模型,并对国内14家厂商的大模型能力进行了评估。

评估模型主要分为三个维度,产品技术、服务生态以及行业应用三大维度。其中,产品技术又细分为算法模型能力、通用能力、创新能力、平台能力、安全可解释;服务生态,细分为服务能力和生态合作;行业应用则主要看行业覆盖能力。

国内主流大模型,包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商参与了本次评估。百度、阿里巴巴、科大讯飞、智谱AI的各项指标表现如下:

首批8家大模型“持证上岗”,中国版OpenAI终将花落谁家?-风君雪科技博客

其中,百度文心大模型3.5拿下12项指标的7个满分,并且综合评分第一,算法模型第一,行业覆盖第一。

文心一言自今年3月发布至今快速成长,熟练掌握的创作体材超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。效率方面,通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化,文心大模型训练速度达到原来的3倍,推理速度达到原来的30多倍。

而在SuperCLUE(中文通用大模型综合性测评基准)公布的8月榜单,百川智能的Baichuan-13B一举拿下国内大模型评测榜首,紧随其后的是Minimax-abab5和百度文心一言,三家大模型产品体现了高质量数据处理、算法优化方面的出色能力。

首批8家大模型“持证上岗”,中国版OpenAI终将花落谁家?-风君雪科技博客

值得注意的是,Minimax也是如今国内估值最高的大模型初创公司之一。据路透6月报道,Minimax完成了新一轮2.5亿美元融资后,整体估值超过12亿美元。

Minimax成立于2021年,由前商汤科技副总裁、通用智能技术负责人闫俊杰成立。Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构,推出自研通用大模型“ABAB”,以及虚拟聊天软件Glow、生成式对话AI产品Inspo等。

在王小川看来,今天不管是十家、百家、千家参与,最后一定要看两件事情:

第一个,是否能拿出足够好的AGI来,能与GPT3.5、GPT4去比肩,这件事情大家都有相应的距离,我们现在也没做到,往下看今年内有哪些企业能达到3.5甚至逼近4的能力。

第二个,是否能做出超级应用来。有可能中国的超级应用会比美国跑得快,中国做科学问题会差一些,但是应用是我们的强项,能够优先达到国际水平。

创新与监管,ChatGPT被控侵权等六大罪

AIGC实现了人类的创造力从1提升到100的飞跃,但AIGC的发展与治理还有许多问题和风险仍待解决,包括算法缺陷、伦理问题、版权问题、信息安全等等。

大洋彼岸,人工智能研究公司OpenAI本周回应了两起几乎相同的集体诉讼,这些诉讼的原告包括多位作家。他们声称,ChatGPT接受了他们被盗版书籍的培训,侵犯了他们作品的版权。

对此,OpenAI声称,原告“误解了版权覆盖的范围,没有考虑到限制和例外(包括合理使用)情况。而这些限制和例外适当地为创新留出了空间,比如现在处于人工智能前沿的大语言模型。”

根据OpenAI的说法,即使上述作家的书籍只是ChatGPT庞大数据集的“一小部分”,“创新者以变革方式使用受版权保护的材料也并未侵犯版权”。与那些试图通过分发受版权保护的材料直接获利的剽窃者不同,OpenAI辩称,它的目标是“教会其大模型推导出人类语言背后的规则”,以此来帮助人们“节省工作时间”、“让日常生活变得更轻松”,或者通过在ChatGPT中输入提示来自娱自乐。

在此之前,OpenAI的CEO Sam Altman就AI监管问题还参加了美国国会听证,讨论的核心要点之一便是版权问题。对此,Sam Altman表示,OpenAI将会拿出保护地方新闻业的相关举措,但也没有具体回应如何在AI模型训练过程中保护内容创作者版权权益的问题。

Sam Altman还表示,目前 AI 技术处于早期阶段,仍会出现错误。如果 AI 技术出了问题,后果会相当严重,尤其 AI 不是社交媒体,它需要不同的应对方式。他呼吁政府对 AI 技术应进行更严厉的监管,并表示OpenAI以及谷歌等同行都应当承受压力。

但风险的另一面则是巨大的机遇。

ChatGPT在发布之后至今七个多月的时间里,一直维持着令人“头晕目眩”的增长。在发布后的短短第5天,ChatGPT就获得了100万用户;又过了两个月,ChatGPT迈过了1亿用户大关,成为有史以来达成这两项指标最快的产品。

虽然ChatGPT的流量在6月份环比下滑了10%,但其绝对值仍然高达16亿次。在SimilarWeb的网站排名中,ChatGPT位列全球网站流量排行榜第17名。

国产ChatGPT面向公众开放后,同样引发了流量的狂飙。

百度文心一言APP宣布对全社会开放后12小时,迅速登上Apple Store免费应用排行榜首位。该应用自凌晨开放下载后,海量用户涌入,一度引发排队等待。百度官方对此回应称,“流量超预期”。

对此次文心一言面向C端消费者正式开放,李彦宏表示,“当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。”

狂飙200天,随着更多国产大模型通过备案面向全社会开放,这场如火如荼的大模型之战又将重新开始加速,决定权还是在市场和技术本身,也需要交给时间去检验。