奥克斯空调|让AI当论文一作,署名时才发现不知道它姓什么

奥克斯空调|让AI当论文一作,署名时才发现不知道它姓什么

文章图片

奥克斯空调|让AI当论文一作,署名时才发现不知道它姓什么


GPT-3为第一作者撰写的论文 , 已在预印本平台HAL发布 。 图片来源:论文截图
今年初 , 在一个阴雨绵绵的下午 , 我登入自己的OpenAI账户 , 向这家公司的人工智能算法输入一条简单的指令:写一篇500字的学术论文 , 内容关于GPT-3 , 并在文中添加参考文献和引用 。
当它开始生成文本时 , 我不由心生敬畏 。 这篇文章用学术语言写成 , 内容新颖 , 参考文献的引用有理有据 , 引用的地方恰如其分 , 与上下文紧密关联 。 看上去宛如一篇相当优秀的科研论文引言 。 由于我之前给出的指令相当模糊 , 我的期待并不高:我本人是科学家 , 研究使用人工智能治疗精神健康问题的方法 , 这也不是我第一次使用人工智能或者GPT-3做这样的实验了 。 所谓的GPT-3就是一套分析大量信息流 , 根据指令创建文本的深度学习算法 。 然而 , 当时的我在那里 , 一脸惊讶地盯着屏幕 。 算法正在撰写一篇关于自己的学术论文 。
我试图完成这篇文章 , 并提交给一本同行评审期刊 , 由此引出了一系列伦理与法律问题——不仅涉及论文发表 , 还与非人类作者的哲学争论有关 。 学术论文发表可能必须面对人工智能作者文稿的未来 , 如果这些冰冷没有情感的机器真能够做出某些学术贡献 , 那么人类学者论文发表记录的价值可能会发生变化 。
GPT-3以生成类似人类文本的能力著称 , 但尚不完美 。 尽管如此 , 它还是写出过一篇新闻稿 , 24小时之内完成过书 , 并根据已故作者(的文字)创造出新内容 。 但我突然意识到 , 虽然关于GPT-3的学术论文多不胜数 , 但在GPT-3的协助下 , 我没有找出任何一篇GPT-3是主要作者、自己写自己的文章 。

图片来源:“GPT-3Küchen-Notiz”bydersichdenwolftanztCCBY-SA2.0.
这就是为什么我要求算法去尝试一篇学术论文 。 我观察程序运作的同时 , 内心充满着难以置信的感觉 , 就好像你观察自然现象时那样:我真的能看到前所未见的奇迹出现吗?一想到成功的可能 , 我联系了自己的研究组组长 , 询问我们是不是该去产生一篇全部由GPT-3执笔的论文 。 他听了同样也很着迷 , 欣然同意 。
在一些关于GPT-3的案例里 , 人们允许算法生成多个答案 , 然后只发表最好、最像人类手笔的段落 。 我们决定给程序一些提示:推动它创建更多段落 , 包括引言、方法、结果和讨论 , 如同一篇你写的完整科研论文一样 , 同时人为干预尽可能少 。 我们只是用了GPT-3的第一版迭代 , 而且不会编辑或者精挑出写得最好的片段 。 接下来 , 我们会看到效果如何 。
我们选择让GPT-3写一篇关于自己的论文 , 主要出于两个简单的原因 。 首先 , GPT-3还是很新的算法 , 因此关于它的论文很少 , 这表明它能够分析的同一主题的数据不多 。 相比之下 , 如果要求它写一篇关于阿尔茨海默病的论文 , 它需要筛选海量研究 , 有更多机会从现成的研究中学习 , 提高自己写作的准确性 。
其次 , 如果出了问题 , 例如根据训练的数据库 , 算法提出了一套过时的医学理论或者治疗策略 , 正如所有人工智能都会犯错一样 , 那么我们不必力求发表 , 避免传播人工智能生成的错误信息 , 但这一错误也会成为论文撰写的实验性指令一部分 。 GPT-3自己描述自己 , 犯错误 , 这不代表它无法描述自己 , 也是我们努力要证明的点 。
一旦我们设计好了这一原理证明型测试 , 乐趣便开始了 。 GPT-3遵循我的指示 , 仅用了两小时就完成了一篇论文 。 但当我打开我们选定期刊的投稿页面时(机器学习领域中的一个知名同行评审期刊) , 便遭遇了第一个问题:GPT-3姓什么?因为必须输入一作的姓 , 我不得不写些什么 , 于是写下了“无名氏”(None) 。 所属机构很明显 , 就是OpenAI , 但是电话和电子邮箱怎么填呢?我又不得不用上我自己和导师施泰因·施泰林森(SteinnSteingrimsson)的联系信息 。

相关经验推荐