AI 顶会 ICML 征稿日在即,关于道德准则的新政策却引来网友不满!规则要求作者不能使用大型语言模型,网友评论区刷屏询问:为什么?

昨天,国际机器学习会议(ICML)发布了 2023 论文征稿公告。

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

论文提交日期为 1 月 9 日至 1 月 26 日。

然而,本次会议中关于「道德准则」的要求却引来了众多不满。

LLM 不可控,还是 ban 掉吧

根据大会的政策,所有作者和程序委员会成员,包括审稿人,应遵循标准的道德准则。

严禁任何形式的抄袭,以及审稿人、领域主席(AC)和高级领域主席(SAC)对特权信息的不道德使用,例如共享此信息,或将其用于评审过程以外的任何其他目的。

禁止包含从大规模语言模型(LLM)(如 ChatGPT)生成的文本的论文,除非这些生成的文本作为论文实验分析的一部分呈现。

所有可疑的不道德行为都将由道德委员会进行调查,被发现违反规则的个人可能会面临制裁。今年,我们将收集被发现违反这些标准的个人姓名;如果代表会议、期刊或其他组织的个人出于决策目的要求提供此列表,我们可能会向他们提供此信息。

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

其中,「禁止使用大型语言模型写论文」一条要求被网友热议。

此消息已发布,网友纷纷在 ICML 推特下评论:「为啥不能用大型语言模型?」

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

AI 论文不能用 AI,合理吗

Yann LeCun 转发并评价:「大型语言模型不能用,意思是中型和小型语言模型还可以用。」

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

他解释说:「因为拼写检查应用和文本预测也是语言模型。」

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

最后,LeCun 阴阳道:「明年的 ICML 道德准则应该变成:研究人员必须徒手完成各种计算,不能借助计算机;各类图形必须用笔和纸手绘;从今天起,ICML 的官方语言变为瑞典语(瑞典:?)。」

最后,还不忘转发一部电影《疯了》,总结自己对 ICML 政策的评价。

在 LeCun 的帖子下,网友们各显神通,纷纷整活。

一位网友给 ICML 提供了新的思路:「另一种表述此策略的方式是‘提交中的所有文本都应由参数小于 100B 或超过 1 万亿的神经网络生成’。」

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

还有人假装是 ICML 的评审,给 ChatGPT 打广告:「作为 ICML 和其他会议的评审 ,我很欣赏作者们使用 ChatGP 等工具润色文章。这会让他们的论文更加清晰易读。(该帖已经过 ChatGPT 的修改)」

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

对于该规则,MIT 教授 Erik Brynjolfsson 简单概括:「这是场必败之仗。」

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

除了整活玩梗,也有人认真表达了自己对 ICML 规定的想法。

AAAI 前主席 Thomas Dietterich 说:「这个规定很怪,对于一个人工智能会议来说更是如此。我们应该欢迎所有为科学技术做出贡献的文章,不论作者是否接受了 AI 的辅助。」

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

也有人给 ICML 改进建议:

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

使用大型语言模型来进行审校对于改善拼写和语法很有裨益。Grammarly,Notion,Google Docs 甚至 Word 都会用到大型语言模型。

看起来,解决方法是解释清楚使用大型语言模型的原因和用途,而非一味禁止。

原来不止我用 Grammarly 检查拼写和语法(doge)。

当然,也有网友对此表示了理解,认为此举是为了保护评审的权威。

网友 Anurag Ghosh 评论道:「我认为 ICML 的要求是为了防止那些看似正确的论文发表。例如机器学习领域发表的 5 篇编造 / AI 生成的论文。这会暴露同行评审的缺陷。」

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

也有人认为,「大型语言模型只是工具,如果它们就可以生成质量更高的论文,那又如何?这些研究的主要贡献不来自于大型语言模型,而来自那些研究人员。难道我们要禁止研究人员接受任何形式的帮助,比如谷歌搜索,或是不能和没有利害关系的人谈论此事吗?」

ICML 征稿禁止使用大型语言模型,LeCun 转发:中小型模型可以用吗-风君雪科技博客

由于最近几年大语言模型的热度始终不减,这次 ICML 提出的禁令引发的学者和网友热烈讨论,想必还会持续一段时间。

不过目前看下来,有一个问题似乎还没人讨论,如何判断一篇文章的片段是不是大语言模型生成的?如何验证,靠查重吗?毕竟真要是机器模型生成的文章,谁也不会特意标注一个「本文是大语言模型自动生成的」,对吧?

更何况,研究论文这种逻辑清晰、结构明确、语言风格高度模式化的文章,简直就是大语言模型发挥的最佳场所,即使是生成的原文略显生硬,但如果是当个辅助工具来用,怕是很难辨别,也就难有明确的标准来实施这个禁令。

这样看来,这次 ICML 的审稿人肩上的担子,怕是又要重了不少了。

参考资料:

  • https://icml.cc/Conferences/2023/CallForPapers

  • https://twitter.com/ylecun/status/1610367976016064513

本文来自微信公众号:新智元 (ID:AI_era),编辑:昕朋 David