输入法|为什么人工智能在Dota中击败了所有人,但在现实世界中却无法生存

输入法|为什么人工智能在Dota中击败了所有人,但在现实世界中却无法生存

文章图片

输入法|为什么人工智能在Dota中击败了所有人,但在现实世界中却无法生存

文章图片

输入法|为什么人工智能在Dota中击败了所有人,但在现实世界中却无法生存

人工智能能否会帮助人们遛狗呢?为什么人工智能有时候像个傻缺一样 , 为什么机器在虚拟世界中而不是在现实世界中快速发展 , 机器学习在这方面有什么帮助?

人工智能的训练指南人工智能预测交通堵塞 , 为播放列表挑选音乐 , 修复信息中的错误 , 清除视频通话中的噪音——这只是它所涉及的一小部分 。 数以百万计的人每天都会遇到人工智能的运作 , 有时候人们甚至都没有意识到这一点 。
【输入法|为什么人工智能在Dota中击败了所有人,但在现实世界中却无法生存】为了让人工智能帮助解决实际问题 , 它必须首先接受训练 。 让我们打一个比方:如果一个人来到国际象棋俱乐部 , 想学习如何下棋 , 教练可以向他解释棋子在某些位置的作用 , 与他一起研究棋子的组合等等;或者他可以简单地给他们棋盘和棋子 , 告诉他们基本的规则 , 推荐几本教科书 。 然后说:师傅领进门 , 修行靠自身 , 现在“你”自己想办法 。

国际象棋人机PK
第一种训练方案是监督学习:一种研究人员为人工智能准备一个带有正确和不正确行动的指南的方法 。 在此基础上 , 机器会学习一种算法 , 用来解决类似的问题 。 像人类一样 , 人工智能接收来自“教师”的反馈 , 分析错误并改善其表现 。
在现实生活中 , 这种方法被应用于预测天气、公司收入和房地产价格 。 银行在决定是否发放贷款时 , 会应用从老师那里学到的知识:人工智能根据多种属性分析客户 , 如年龄、工资、经验、信用记录、财产所有权 , 并确定他是否有能力偿还要求的金额 。 应用这种技术的另一个服务例子是语音助手 。 开发人员可以向计算机上传了许多文本和音频记录 , 以便神经网络能够 \"学习 \"进行对话 。
纠正监督一直是训练过程中必不可少的一环 。 但现在 , 人们正在重新考虑通常的机制:如果给予孩子犯错和独立搜索的权利 , 就会更多地得到赞赏 。 为此 , “学生”被安排在一个模拟环境中 , 可以立即对真实情况进行各种技能的磨练 。

强化学习也是机器学习的另外一种选择 。 在这种情况下 , 计算机 , 或如科学家所说的 \"代理人\" , 没有明确行动的训练算法 。 人工智能采取了一个行动 , 然后看环境和它在其中的位置如何变化 。 如果这一行动是成功的 , 并使人工智能更接近于实现其目标 , 那么它就会得到奖励——这鼓励它继续朝着所选择的方向前进 。 在相反的情况下 , 人工智能会失去奖励积分 , 并退后几步 , 对其行动“轨迹”进行修改 。 随着机器逐渐适应陌生的环境 , 它了解对它的要求和实现手头任务的最佳方式 。
以人工智能为例:学会跟进和忍耐假设我们想训练一台机器来遛狗 。 这是一项复杂的任务 , 可以分成几个阶段:机器人必须把狗叫到门口 , 给它穿上衣服 , 固定好狗链 , 到外面去 , 确保它不会挣脱和向人扔东西 , 然后回到家里 , 给它脱衣服 , 洗它的爪子 。 在强化训练中 , 机器的任务是独立地将请求分解成单个动作 , 并找到执行这些动作的最佳方式 。 起初 , 系统可能会尝试不带狗绳出去 。 下一次 , 机器人会穿上安全带 , 但忘记在寒冷中为狗保温 。 人工智能可以无数次地尝试这样的事情 , 直到它找到最好的方法 。 在这方面 , 它是一个比人类更勤奋的学习者 。

相关经验推荐