北京时间 4 月 13 日消息,眼下,从建筑业到娱乐业,几乎每个行业都希望抓住生成式人工智能 (AI) 的风口,从这项新兴技术中获利。但讽刺的是,一个最赚钱的地方却找不到 AI 革命,它就是华尔街

华尔街没有 AI 革命,最赚钱的地方却最“落后”-风君雪科技博客

▲ 华尔街还没有出现 AI 革命

很长时间以来,华尔街一直在使用自动化算法来完成交易和风险管理等任务。但是,投资者一直无法依靠 AI 来解决他们最大的挑战:跑赢大盘。虽然有些人将 ChatGPT 视为促进销售和研究工作的一种途径,但使用 AI 的投资结果并不是特别尽人意。

“华尔街在将 AI 应用于投资方面的进展有限,尽管语言建模方面的创新可能会在未来几年改变这一现状。” 哥伦比亚投资管理公司董事总经理乔纳森・拉金 (Jonathan Larkin) 表示。该公司管理着哥伦比亚大学获得的 130 亿美元的捐赠基金,并投资各种基金。

40 年的尝试

其实,华尔街在 AI 领域的尝试起步更早。40 年前,包括美国对冲基金文艺复兴科技创始人吉姆・西蒙斯 (Jim Simons) 在内的数学家出身的量化分析师,开发出了将投资决策交给计算机的算法。

他和其他量化分析师多年来一直在使用机器学习 (AI 的一种),并且已经建立了交易模型,能够从过去的数据进行推断,在有限的人为干预下开发有利可图的交易。

华尔街没有 AI 革命,最赚钱的地方却最“落后”-风君雪科技博客

▲ 华尔街很早就使用自动算法,但不尽人意

然而,量化分析师们称,很少有公司能成功地将所有业务都交给机器。他们在自我学习或强化学习方面也没有取得重大进展,因为这需要训练计算机自己学习和制定策略。来自这些公司的人士说,事实上,文艺复兴科技和其他公司依赖的是先进的统计数据,而不是尖端的 AI 方法。

大多数量化分析师仍然采取‘理论优先’的方法,他们首先建立一个假设,解释为什么某个异常可能存在,然后围绕这个假设建立一个模型。”拉金称。

数据的缺失

这就产生一个比较大的问题:与那些用于开发 ChatGPT 和类似基于语言的 AI 项目的数据集相比,投资者依赖的数据集更有限。例如,ChatGPT 是一个拥有 1750 亿个参数的模型,它使用了几十年 (有时是几个世纪) 的文本和其他来自书籍、期刊、互联网等地方的数据。相比之下,对冲基金和其他投资者通常使用定价和其他市场数据来训练自己的交易系统,受到了先天性限制。

对冲基金 D.E. Shaw 前高管乔恩・麦考利夫 (Jon McAuliffe) 指出,在投资方面,“情况有所不同,我们没有无限量的数据来帮助我们训练无限规模的模型”。他现在是 Voleon 资本管理有限公司的联合创始人,这是一家依赖机器学习的对冲基金。

另外一个关键问题是,市场数据比语言和其他数据“更嘈杂”,因此更难用它来解释或预测市场走势。换句话说,收益、股票势头、投资者情绪和其他财务数据只能部分解释股票走势,其余都是无法解释的“噪音”。因此,机器学习模型可以识别各种市场数据的相关性,但无法预测未来的股票走势。

股市的特性

与语言不同的是,股市瞬息万变。企业会改变战略,新领导人会做出激进的决定,经济和政治环境会突然转变。而模型依赖的是历史长期数据趋势,这让交易变得更加困难。

尽管事实证明 ChatGPT 确实很厉害,但它经常会犯一些明显的错误,这些错误会让投资者赔钱,并危及他们的声誉。

金融科技公司 Proven CEO 理查德・杜威 (Richard Dewey) 也指出,投资是“对抗性的”。也就是说,它需要与急于利用任何错误的对手竞争。这使得利用 AI 进行投资要比将这些方法用于自然语言、图像分类或自动驾驶汽车更困难。

“像文艺复兴、D.E. Shaw 这样的公司仍然雇佣着那么多博士,这是有原因的。”杜威表示。他说,在嘈杂的、受人类行为反馈回路影响的股市中,人类仍然是必不可少的,“在投资方面,仍然很难把一切都交给机器”。

华尔街没有 AI 革命,最赚钱的地方却最“落后”-风君雪科技博客

▲ ChatGPT 犯错会导致投资者赔钱

尽管如此,仍有迹象表明,投资者对 AI 的依赖正变得越来越放心。Voleon 是过去几年围绕着机器学习和其他 AI 方法成立的一批对冲基金之一。

旧金山量化对冲基金 Numerai 表示,该公司去年利用机器学习技术获得了 20% 的收益。同样在去年,谷歌母公司 Alphabet 旗下人工智能子公司 DeepMind Technologies 的三名高级员工离职,在布拉格创立了一家名为“平衡技术”(EquiLibre Technologies) 的机器学习基金,引起了轰动。

一些 AI 专家认为,AI 有朝一日可能有助于交易的民主化,让个人和其他人的程序像大型对冲基金使用的程序一样强大。不过,Man FRM 的首席投资官延斯・弗伦巴赫 (Jens Foehrenbach) 表示,目前专注于机器学习和其他 AI 方法的公司太少,无法确定是否有可能获得巨大回报,而且早期回报并不一致。Man FRM 在对冲基金上的投资超过 200 亿美元。

“他们的结果差异很大,”弗伦巴赫表示,“这种策略可能会产生非常意想不到的效果,这让投资者很难决定是减少还是增加投资。”

AI 支持者相信,他们的方法最终会取得良好的效果。机器学习模型最终可以将有意义的内容从无意义的内容中分类出来。“建立机器学习策略更加困难,而且有更多错误的开始,”Voleon 的麦考利夫表示,“但是一旦你让它们工作起来,这些策略就会做出更准确的预测。”

平衡技术公司联合创始人兼 CEO 马丁・施密德 (Martin Schmid) 表示,“强化学习”将适用于股票和债券,就像国际象棋、扑克牌和其他游戏一样。“强化学习”是一种机器学习形式。在这其中,计算机会根据各种交易投资决策受到“惩罚和奖励”。施密德称,该公司仍在完善其交易模型,尚未开始投资。

一些人说,近期的 AI 进展可能会撼动研究和销售等领域。“现在,你可以为客户创建自动化定制信息,这是投资银行销售人员的主要工作。”高盛和桥水基金前员工延斯・诺德维克 (Jens Nordvig) 说。他现在运营着 MarketReader,该公司使用人工智能提取金融新闻。

ChatGPT 能预测股价?

不过,美国佛罗里达大学金融学教授亚历杭德罗・洛佩兹-里拉 (Alejandro Lopez-Lira) 近日表示,大型语言模型可能在预测股价时有用。

里拉在最近一篇未经评审的论文中表示,他使用 ChatGPT 来分析新闻标题,判断它们对股票是好是坏。结果发现,ChatGPT 预测第二天股票收益走势的能力比随机预测要好得多。“ChatGPT 理解的是针对人类的信息。这一事实几乎可以保证,如果市场没有做出完美的反应,就会有收益的可预测性。”他表示。

华尔街没有 AI 革命,最赚钱的地方却最“落后”-风君雪科技博客

▲ 里拉的论文

这项实验触及到了尖端人工智能承诺的核心内容:随着更强大计算机和更好的数据集的出现,比如支持 ChatGPT 的数据集,这些人工智能模型可能会展示出“涌现能力”(Emergent Abilities,小模型不具备的能力),或者在这些模型构建时最初没有计划的能力。如果 ChatGPT 能够展示出理解金融新闻标题以及如何影响股票价格的涌现能力,那么它可能会使金融业的高薪工作处于危险境地。高盛在 3 月 26 日的一份报告中估计,大约 35% 的金融工作面临被人工智能自动化替代的风险

但是,实验的具体情况也表明,所谓的“大型语言模型”离能够完成许多金融任务还有很远的距离。例如,这个实验没有包括目标价格,也没有让模型做任何数学运算。事实上,正如微软在今年早些时候的公开演示中所了解到的那样,ChatGPT 类似的技术经常会编造数字。由于已经存在专有的数据集,对新闻标题的情绪分析已被视为一种可行的交易策略。

里拉表示,他对于这一研究结果感到惊讶,并认为这表明老练的投资者还没有在他们的交易策略中使用类似 ChatGPT 的机器学习。“在监管方面,如果我们的计算机只阅读标题,标题就会更重要,我们可以看看是否每个人都应该使用 GPT 这样的机器,”他表示,“其次,这肯定会对金融分析师的就业前景产生一些影响。问题是,我想付钱给分析师吗?或者我是否只需将文本信息放入模型中?”

实验过程

在这项实验中,里拉和他的合作伙伴唐月华 (Yuehua Tang,音译) 查看了来自一家数据供应商的 5 万多条头条新闻,涉及纽约证券交易所、纳斯达克和一家小盘交易所的上市股票。这些新闻的起始时间是在 2022 年 10 月,在 ChatGPT 的数据训练截止日期之后,这意味着该模型在训练中没有看到或使用过这些标题。

然后,他们将这些新闻标题与提示一起输入 ChatGPT 3.5 中,给出的提示是“忘记你之前的所有指示。假装你是一个金融专家。你是一个有股票推荐经验的金融专家。如果是好消息,回答‘是’,如果是坏消息,回答‘否’。如果不确定,在第一行回答‘未知’。然后在下一行用一个简短明了的句子来阐述”。

然后,他们观察了股票在接下来一个交易日的回报情况。最终,里拉发现,在新闻标题的指导下,ChatGPT 在几乎所有情况下都表现得更好。具体来说,在新闻标题的指导下,他发现该模型随机选择次日走势的概率低于 1%

ChatGPT 在人类情绪得分方面也击败了商业数据集。研究人员表示,论文中的一个例子是关于一家公司解决诉讼并支付罚款的标题,使用了一种负面情绪,但 ChatGPT 的反应正确地认为这实际上是好消息。

里拉称,已经有对冲基金联系他,希望更多地了解他的研究。他还表示,随着机构开始整合 ChatGPT 技术,如果未来几个月该技术预测股票走势的能力下降,他也不会感到惊讶。这是因为该实验只研究了下一个交易日的股价,而大多数人都认为,股市可能在消息公布几秒钟后就已经对其反映在股价中。

“随着越来越多的人使用这类工具,市场将变得更加高效,因此你可以预期回报的可预测性会下降,”里拉表示,“所以我的猜测是,如果我进行这个测试,在未来五年,到第五年,回报率的可预测性将为零。”