登上《自然》封面的索尼赛车AI,是如何击败人类顶级车手的?

"我们追求人工智能 , 是为了最终更好地了解人类 。 "
作为这个世代中为数不多的拟真赛车游戏 , 《GT赛车Sport》的玩家们可能从来没有想过 , 自己玩的游戏 , 有天会登上世界顶级科学期刊《自然》(Nature)的封面 。
在昨天 , 索尼公布了一款由其旗下AI部门开发的人工智能技术 , 同时它也相应地成为了本周《自然》的"封面人物" , 而这个人工智能的成就 , 是在《GT赛车Sport》中击败了全球一流赛车游戏选手们 。
登上《自然》封面的索尼赛车AI,是如何击败人类顶级车手的?
文章图片
或者 , 用"征服"这个词来形容更为合适 。 在索尼演示的四位AI车手与四名职业赛车玩家的对决中 , 冠军AI的最高圈速比人类中的最优者快了两秒有余 。 对一条3.5英里长度的赛道而言 , 这个优势一如AlphaGo征服围棋 。
在近五年的研发时间里 , 这个由索尼AI部门、SIE还有PDI工作室(也就是《GT赛车》开发商)共同研发的AI完成了这个目标 。
登上《自然》封面的索尼赛车AI,是如何击败人类顶级车手的?】索尼为这个AI起名为GTSophy 。 "索菲"是个常见的人名 , 源自希腊语σοφα , 意为"知识与智慧" 。
Sophy和一般的游戏AI有什么区别?
AI在游戏中打败人类 , 并不是一件稀奇事 。 OpenAI在"冥想训练"了成千上万场DOTA2后击败过当时的Ti8冠军OG , 谷歌的AlphaStar也曾面对《星际争霸2》的顶级职业选手时表现过碾压态势 , 而我们每个普通玩家 , 也都尝过"电脑[疯狂的]"的苦头 。
登上《自然》封面的索尼赛车AI,是如何击败人类顶级车手的?
文章图片
但这些"打败"并非一回事 。 要明白GTS中的AI车手Sophy意味着什么 , 首先要明确Sophy和其一个单纯"你跑不过的AI"有什么区别 。
对过往赛车游戏里的AI而言 , 尽管呈现形式都是游戏中非玩家控制的"智能体" , 但传统意义上的AI车手通常只是一套预设的行为脚本 , 并不具备真正意义上的智能 。
传统AI的难度设计一般也是依赖"非公平"的方式达成的 , 比如在赛车游戏中 , 系统会尽可能削弱甚至消除AI车的物理模拟 , 让AI车需要处理的环境参数远比玩家简单 。
而要塑造更难以击败的AI敌人 , 也不过是像RTS游戏中的AI通过暗中作弊的方式偷经济暴兵一样 , 让AI车在不被注意的时刻悄悄加速 。
所以对于具备一定水平的玩家而言 , 赛车游戏里的传统AI在行为逻辑和策略选择上几乎没有值得参考的点 , 遑论职业赛车游戏选手 。
而Sophy则是和AlphaGo一样 , 通过深度学习算法 , 逐渐在模拟人类的行为过程中达到变强:学会开车 , 适应规则 , 战胜对手 。
这种AI带给玩家的 , 完全是"在公平竞争中被击败"的体验 。 在被Sophy击败后 , 一位人类车手给出了这样的评价:"(Sophy)当然很快 , 但我更觉得这个AI有点超乎了机器的范畴……它像是具备人性 , 还做出了一些人类玩家从未见过的行为 。 "
登上《自然》封面的索尼赛车AI,是如何击败人类顶级车手的?
文章图片
相对于围棋这种信息透明的高度抽象游戏 , 玩法维度更多、计算复杂度更高的电子游戏 , 在加入深度学习AI之后 , 其实一直很难确保"公平竞技"的概念 。
例如在2019年征战《星际争霸2》的AlphaStar , 基本没有生产出新的战术创意 , 只是通过无限学习人类选手的战术 , 再通过精密的多线操作达成胜利——即便人为限制了AlphaStar的APM , AI完全没有无效操作的高效率也并非人类可比 。
这也是为什么在AlphaStar与人类职业选手的对抗记录里 , 当AI用"三线闪追猎"这样的神仙表演击败波兰星灵选手MaNa后 , 并不服气的MaNa在赛后采访中说出了"这种情况在同水平的人类对局中不可能出现"这样的话 。

相关经验推荐