你认为的 AGI 是什么样子的?OpenAI 联创、前特斯拉 AI 总监 Karpathy 发文,用自动驾驶诠释 AGI!对于「通用人工智能」,OpenAI 科学家 Karpathy 下场做出了解释。

前几天,Karpathy 在个人 blog 发表了一篇文章「将自动驾驶作为 AGI 的一个案例来研究」。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

不知是何原因,他却删除了这篇文章,幸而,还有网络备份。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

众所周知,Karpathy 不仅是 OpenAI 的创始成员之一,还曾是特斯拉前 AI 高级总监、自动驾驶 Autopilot 负责人。

他将自动驾驶作为案例,研究 AGI,这篇文章的观点确实值得一看。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

自动驾驶

LLM 的爆发引发了众多关于 AGI 降临的时间,甚至它可能是什么样子的讨论。有的人对 AGI 未来充满希望,持有乐观的态度。而有的人却充满恐惧和悲观的情绪。

不幸的是,其中也有很多讨论过于抽象,导致人们的观点互不接轨。因此,我总是在寻找具体的类比和历史先例,用更具体的术语来探讨这个主题。

特别是,当我被问及「你认为 AGI 会是什么样子」时,我个人喜欢用自动驾驶举例。在这篇文章中,我想解释一下原因。让我们从 AGI 的一个常见定义开始:

AGI:一个在大多数有经济价值的工作中超越人类能力的自主系统。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

请注意,在这个 AGI 定义中有两个具体要求。

首先,它是一个完全自主的系统,即自己运作,很少或根本没有人类监督。

其次,它在大多数有经济价值的工作上都是自主运作的。关于这部分数据,我个人喜欢参考美国劳工统计局的职业指数。

一个同时具有这两种性质的系统,我们将其称之为 AGI。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

我想在这篇文章中建议的是,最近我们自动驾驶能力的发展是一个非常好的早期案例,研究了日益自动化的社会动态,可以拓展到对 AGI 的总体样貌和感受的研究。

我这样认为的原因是,这个领域具有几个特征。可以简单地说「it is a big deal」:自动驾驶对社会来说非常容易理解,更常见。

它在经济规模上占据了很大一部分,并且雇佣了大量的人类劳动力。驾驶是一个足够复杂的问题,但我们已经实现自动化,并引来社会的高度关注。

当然,也还有其他的行业实现了大规模的自动化,但要么是我个人对它们不太熟悉,要么它们在上述一些属性方面有所欠缺。

L2 级自动化

驾驶的自动化被认为是 AI 领域中一个极具挑战的问题,并非一蹴而就。

它是通过逐步将驾驶任务自动化的过程而成的,这个过程中涉及了许多阶段性的「工具型 AI」。

在车辆自动化方面,目前许多汽车已经配备了 L2 级驾驶辅助系统。即一个能与人类司机协作,共同完成从起点到终点旅程的 AI。

虽然它还不能完全自主驾驶,但 L2 已经能处理许多驾驶中的基础任务。有时,它甚至能自动完成整个操作流程,比如自动泊车。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

在这一过程中,人类主要扮演监督角色,甚至可以随时接手,直接驾驶或下达高级指令(如换道请求)。

在某些方面(比如保持车道居中和快速决策),AI 的表现甚至超过了人类,但在一些罕见的情况下还是会有所不足。

这与我们在其他行业看到的许多 AI 工具非常相似,特别是随 LLM 最近的技术突破。

例如,作为程序员,当我用 GitHub Copilot 来自动补全一段代码,或使用 GPT-4 编写更复杂的函数时,我实际上是将基础任务交给了自动化系统.

但同样,如有需要,我也可以随时介入进行调整。

换句话说,Copilot 和 GPT-4 就像是在编程领域的「二级」自动化工具。

在整个行业中,有许多类似的「二级」自动化解决方案,但并不是所有的都基于大模型,从 TurboTax,到亚马逊仓库中机器人,再到翻译、写作、艺术、法律、营销等领域的各种「工具型 AI」。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

全自动驾驶

随着时间的推移,一些系统的可靠性达到了新高度,变得就像今天的 Waymo 那样。

它们正逐步实现「全自动驾驶」。

如今,在旧金山,你只需打开应用,就能叫到一辆 Waymo 无人驾驶车,它将会来接你,并把你安全送达目的地。

这实在是令人惊叹。你无需懂得驾驶,也无需关注路况,只需舒服地靠后坐,并小憩片刻,系统便会将你从起点带到终点。

与我交谈过的许多人一样,我个人更倾向于选择 Waymo 而非 Uber,我几乎只使用它来进行市内交通。

你会拥有更稳定、可预测的旅程体验,而且驾驶过程平稳,可以听音乐,不用顾及司机在听你说话时在想什么。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

「复合经济」

虽然自动驾驶技术已经走入现实,但仍有许多人选择使用 Uber。原因何在?

首先,很多人根本不知道他们可以选择 Waymo 作为出行工具。即便知道,许多人对自动化系统仍缺乏足够的信任,更倾向于由人类司机驾驶。

不过,即使有些人接受自动驾驶,或许他们还是更倾向于人类司机,比如享受与司机的交谈,以及与他人的互动。

不仅仅是个人偏好,从现在应用中不断增长的等待时间可以看出,Waymo 面临着供不应求的问题。市场上的车辆数量远远无法满足需求。

这部分原因可能是,Waymo 在管理和监测风险和舆论方面非常谨慎。

另一方面,据我所知,Waymo 受到监管机构的限制,只能在街道上部署一定数量的车辆。另一个限制因素是,Waymo 不能一夜之间就完全取代 Uber。

他们需要建立基础设施,生产汽车,扩大运营规模。

我个人认为,其他经济领域的自动化也将面临同样的情况 —— 有些人 / 公司会立即采用它们,但许多人(1)不了解这些技术,(2)即便了解,也不会信任它们,(3)即使信任,他们仍然更愿意与人类合作。

但除此之外,需求超过供应,AGI 也将因为同样的原因受到同样的限制,包括开发商的自我约束、监管限制以及资源短缺,比如需要建立更多的 GPU 数据中心。

技术全球化

正如我已经在资源限制中暗示的那样,这种技术的全球化部署成本非常高,还需要耗费大量人力,推广速度也慢。

今天,Waymo 只能在旧金山和凤凰城驾驶,但这种技术本身是通用的,还可以扩展,因此该公司可能很快就会推广到洛杉矶、奥斯汀等地。

自动驾驶汽车还可能会受到其他环境因素的限制,比如在大雪中驾驶。在一些罕见的情况下,它甚至可能需要操作员的救援。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

此外,技术能力的扩展还需要很多资源成本,并非是免费的。

比如,Waymo 必须投入资源后才能进入另一个城市,比如绘制街道地图、整体感知路径规划、控制算法以适应某些特殊情况,或当地的法规。

就像我们的工作比喻所示,许多工作可能只在某些特定环境下才能实现自动化,若是扩大范围还需要大量的工作。

无论哪种情况,自动驾驶技术本身都是通用的和可扩展的,其应用前景将随着时间的推移而逐步拓宽。

社会反应:很快成为「过眼云烟」

关于自动驾驶技术逐渐融入社会的过程,我觉得特别有趣的一点是 ——

就在几年前,人们还在热烈讨论并对其充满了疑虑和担忧,争论着它是否能够成功运作,甚至是否可行,这成了一个广泛关注的议题。而现在,自动驾驶不再是未来的梦想,它真的出现了。

它不仅仅是一个研究原型,而是成为了一种可以用金钱购买的完全自动化交通方式。

在目前的应用范围内,自动驾驶技术已经实现了完全的自主性。

然而,总体来看,这似乎并没有引起太多人的关注。我交流过的大多数人(包括科技领域的!)甚至都不知道这一进展。

当你乘坐 Waymo 在旧金山的街道上行驶时,你会发现很多人对它投以好奇的目光。他们首先会感到惊讶,然后好奇地凝视。之后,他们就会继续自己的生活。

当自动驾驶技术在其他行业也实现完全自主时,世界可能并不会因此而动荡不安。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

大多数人可能一开始,甚至都没意识到这一变化。当他们注意到时,可能只是好奇地看一眼,然后不以为意,这种反应从否认到接受都有。

有些人可能会因此感到不安,甚至采取一些抗议行动,比如向 Waymo 汽车前放置交通锥这样的举动。

当然,到目前为止,我们距离见证这一现象完全上演还很遥远。但当它发生时,我期望它在很大程度上具有预测性。

经济影响

当我们讨论就业时,不可否认,Waymo 明显地取代了驾驶员的岗位。

但同时,它也催生了许多以前不存在的工作岗位,这些岗位相对不那么显眼 —— 比如为神经网络收集训练数据的标注人员、远程协助遇到问题汽车的客服人员、负责建造和维护车队的工作人员等等。

首先诞生的是一个包含各种传感器和相关基础设施的全新行业,旨在构建这些装备精密的高科技汽车。

正如人们对工作的普遍看法一样,许多岗位都将发生改变,一些岗位会因此消失,但也会出现很多新的岗位。

这其实是工作形态的一种转变,而非简单的岗位减少,尽管岗位减少是最直观的变化。

虽然很难说总体就业人数不会随着时间推移而减少,但这种变化的速度比人们简单预想的要慢得多。

竞争环境

最后,我想谈谈自动驾驶领域的竞争环境。

几年前,自动驾驶汽车公司如雨后春笋般涌现。但今天,随着人们逐渐意识到这项技术的复杂性(我个人认为,基于当前的人工智能和计算技术,实现自动化仍然十分困难),这个领域已经经历了大规模的整合。

其中,Waymo 成为了首个完整展示自动驾驶未来的公司。

尽管如此,还有一些公司仍在紧追不舍,比如 Cruise、Zoox,以及我个人特别喜欢的 Tesla。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

这里我要简单提一下,基于我在这个领域的经历和参与。在我看来,自动驾驶行业的终极目标是实现全球范围内的完全自动驾驶。

Waymo 选择了先实现自动驾驶再全球扩展的策略,而 Tesla 则是先全球布局再逐步提升自动驾驶技术。

显然,这两家公司将会面临截然不同的调整:一家主要是软件方面的工作,另一家则是硬件方面的工作。

目前,我对他们的产品都非常满意,个人而言,我更是对技术本身充满了支持。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

同样的,很多其他行业也可能经历一个快速增长和扩张的阶段(就像大约在 2015 年的自动驾驶领域),但最终,可能只有少数几家公司在这场竞争中存活下来。

在这个过程中,将会有许多实用的 AI 辅助工具(比如现在的 L2 ADAS 功能)和一些开放平台(比如 Comma)得到广泛应用。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

通用人工智能(AGI)

以上就是我对通用人工智能(AGI)未来发展的大致设想。

想象一下,这样的变革将以不同的速度遍布整个经济体,并伴随着许多难以预料的相互影响及连锁反应。

虽然这个设想可能不尽完美,但我认为它是一个值得记住并有益参考的模型。

从模因(memetic)的角度来看,AGI 与那种逃离我们控制、在网络空间自我递归提升、制造致命病原体或纳米机器人、最终把银河系变为灰色粘质的超级智能相去甚远。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

相比之下,它更像是自动驾驶技术的发展 —— 一项正在快速推进且能改变社会的自动化技术。其发展速度会在包括受教育的劳动力资源、信息、材料、能源,以及监管等多个方面受到限制。

在这之中,社会既是观察者也是参与者。

世界不会因此崩溃,而是会适应、变化并重新构建。

就自动驾驶本身而言,交通自动化将大大提升安全性,城市将变得更加清新、通畅,而那些占据道路两旁的停车场和停放的汽车将逐渐消失,从而让出更多的空间。

对于通用人工智能(AGI)带来的所有这些可能的变革,我个人是充满期待的。

网友热议

总而言之,Karpathy 将 AGI 看作更像是自动驾驶的发展,这一具体类比的观点,引发了众多网友的讨论。

「看到那个无法交付 FSD 的人,决定将 FSD 与 AGI 进行类比,实际上确实给了我信心,我们还有几十年的时间」。

是啊,他好像忘记了「G」。我记得 Norvig 在几十年前的人工智能著作中曾说过,「智能」并不意味着无所不能,一个智能体要想有用,解决一个小问题就足够了。在我看来,这就是 G 的由来。

而我们现在却突然又回到了以前那个狭隘的定义?我仍然看不到从 LLM 和自动驾驶到 AGI 的路径。

OpenAI 联合创始人 Karpathy 发文:用自动驾驶诠释通用人工智能 AGI-风君雪科技博客

当然,AGI 的发展可能是渐进而缓慢的,就像我们看到 Waymo 打造自动驾驶汽车一样。但这只是众多方式中的一种,你也可以看到 AGI 通过非常不同的方式突然出现,就像通过扩展大规模 LLM 那样。

参考资料:

  • https://web.archive.org/web/20240122062223/https://karpathy.github.io/2024/01/21/selfdriving-agi/