别被火爆全网的ChatGPT“骗了”( 二 )


有人将ChatGPT比喻为“搜索引擎+社交软件”的结合体,能够在实时互动的过程中获得问题的答案 。很多用户抱着好玩的心态和ChatGPT互动,但伴随着体验的深入,也会担心 , 自己会不会有朝一日因为AI而失业 。
国盛证券区块链研究院在研报中表示,ChatGPT在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎,ChatGPT或许在未来会改变我们获取信息、输出内容的方式,AIGC有望成为数字经济时代驱动需求爆发的杀手级应用 。
ChatGPT能够实现当前的交互,离不开OpenAI在AI预训练大模型领域的积累 。OpenAI是微软投资的AI实验室,也是全球AI领域最为领先的AI实验室之一,一直因为技术层面的领先,被当作是AI领域的行业“灯塔” 。
从2018年起,OpenAI就开始发布生成式预训练语言模型GPT(Generative Pre-trained Transformer),可用于生成文章、代码、机器翻译、问答等各类内容 。在当时,参数量只有1.17亿 。
接下来 , OpenAI每一代GPT模型的参数量都爆炸式增长,2019年2月发布的GPT-2参数量为15亿 , 而2020年5月的GPT-3,参数量达到了1750亿 , 直接带动了预训练大模型成为AI领域近两年的发展趋势,掀起一场拼参数、拼算力的军备竞赛 。
GPT-4还未到来 , 这一次发布的ChatGPT,被视为是基于GPT-3的微调版本,即GPT-3.5 。
OpenAI表示 , ChatGPT采用的模型使用了“利用人类反馈强化学习(RLHF)”的训练方式 , 包括了:人类提问机器答、机器提问人类回答 , 并且不断迭代,让模型逐渐有了对生成答案的评判能力 。相比GPT-3,ChatGPT的主要提升点在于记忆能力,可实现连续对话,极大地提升了对话交互模式下的用户体验 。
警惕ChatGPT的“随机编造”
ChatGPT也并不是总能给人带来惊喜,不可否认,它还存在许多局限性 。
当你要求ChatGPT进行创作时,它可以自由发挥,但是 , 当你的目的是寻求正确答案时,ChatGPT可能有时无法满足期待 。
比如,让ChatGPT背一下《观沧海》这首诗,它却即兴创作了一首 。

别被火爆全网的ChatGPT“骗了”

文章插图



ChatGPT“即兴创作”《观沧海》/ 深燃截图
而让ChatGPT做一道小学数学题,它看似写出了一长串计算过程,给出的却是错误答案 。
别被火爆全网的ChatGPT“骗了”

文章插图



ChatGPT对于部分题无法给出正确答案 / 深燃截图
深度体验后会发现 , ChatGPT对于一些文化常识问题、数学计算题不是太擅长 。而且 , ChatGPT的回答往往是大段长段,过于冗长,看似逻辑自洽,但有时是在一本正经地“忽悠人”,仔细思索会发现存在一定漏洞 。如果非专业人士无法分辨ChatGPT答案的准确性,极有可能会被严重误导 。
Stack Overflow就因此做出了暂时封禁的决策 。据悉,ChatGPT面世之后,Stack Overflow上很快便出现了大量由该模型生成的答案 。这些答案通常需要具备一些专业知识的人详细阅读才能分辨出是错误的 。
这种情况让Stack Overflow的质量管理遭到冲击 。ChatGPT也表示:“因为AI生成的答案不总是准确或相关的,可能会导致Stack Overflow上混淆错误答案,误导在寻求帮助的用户 。”并且还表态:“Stack Overflow禁止用AI生成答案是合理的 。”
OpenAI也提到 , ChatGPT有时会给出看似合理但不正确的答案 。对于这一问题 , Sam Altman表示:“正试图阻止ChatGPT随机编造 , 现阶段让其与当前技术保持平衡是很棘手的 。随着时间的推移 , 会根据用户反馈来改进 。”

相关经验推荐