输入法|为什么人工智能在Dota中击败了所有人，但在现实世界中却无法生存输入法

文章图片

文章图片

人工智能能否会帮助人们遛狗呢？为什么人工智能有时候像个傻缺一样，为什么机器在虚拟世界中而不是在现实世界中快速发展，机器学习在这方面有什么帮助？

人工智能的训练指南人工智能预测交通堵塞，为播放列表挑选音乐，修复信息中的错误，清除视频通话中的噪音——这只是它所涉及的一小部分。数以百万计的人每天都会遇到人工智能的运作，有时候人们甚至都没有意识到这一点。
【输入法|为什么人工智能在Dota中击败了所有人，但在现实世界中却无法生存】为了让人工智能帮助解决实际问题，它必须首先接受训练。让我们打一个比方：如果一个人来到国际象棋俱乐部，想学习如何下棋，教练可以向他解释棋子在某些位置的作用，与他一起研究棋子的组合等等；或者他可以简单地给他们棋盘和棋子，告诉他们基本的规则，推荐几本教科书。然后说：师傅领进门，修行靠自身，现在“你”自己想办法。

国际象棋人机PK
第一种训练方案是监督学习：一种研究人员为人工智能准备一个带有正确和不正确行动的指南的方法。在此基础上，机器会学习一种算法，用来解决类似的问题。像人类一样，人工智能接收来自“教师”的反馈，分析错误并改善其表现。
在现实生活中，这种方法被应用于预测天气、公司收入和房地产价格。银行在决定是否发放贷款时，会应用从老师那里学到的知识：人工智能根据多种属性分析客户，如年龄、工资、经验、信用记录、财产所有权，并确定他是否有能力偿还要求的金额。应用这种技术的另一个服务例子是语音助手。开发人员可以向计算机上传了许多文本和音频记录，以便神经网络能够 \"学习 \"进行对话。
纠正监督一直是训练过程中必不可少的一环。但现在，人们正在重新考虑通常的机制：如果给予孩子犯错和独立搜索的权利，就会更多地得到赞赏。为此， “学生”被安排在一个模拟环境中，可以立即对真实情况进行各种技能的磨练。

强化学习也是机器学习的另外一种选择。在这种情况下，计算机，或如科学家所说的 \"代理人\" ，没有明确行动的训练算法。人工智能采取了一个行动，然后看环境和它在其中的位置如何变化。如果这一行动是成功的，并使人工智能更接近于实现其目标，那么它就会得到奖励——这鼓励它继续朝着所选择的方向前进。在相反的情况下，人工智能会失去奖励积分，并退后几步，对其行动“轨迹”进行修改。随着机器逐渐适应陌生的环境，它了解对它的要求和实现手头任务的最佳方式。
以人工智能为例：学会跟进和忍耐假设我们想训练一台机器来遛狗。这是一项复杂的任务，可以分成几个阶段：机器人必须把狗叫到门口，给它穿上衣服，固定好狗链，到外面去，确保它不会挣脱和向人扔东西，然后回到家里，给它脱衣服，洗它的爪子。在强化训练中，机器的任务是独立地将请求分解成单个动作，并找到执行这些动作的最佳方式。起初，系统可能会尝试不带狗绳出去。下一次，机器人会穿上安全带，但忘记在寒冷中为狗保温。人工智能可以无数次地尝试这样的事情，直到它找到最好的方法。在这方面，它是一个比人类更勤奋的学习者。

输入法|为什么人工智能在Dota中击败了所有人，但在现实世界中却无法生存

相关经验推荐

XYG二队已经崛起！老板张大仙特别“负重训练”，麋鹿被破绽替代

鸡蛋的保质期有多长时间

唐山健康管理师考试时间唐山健康管理师准考证号查询流程

LPL首发名单出炉，Uzi再度替补，Rookie或成新击杀王

音乐学专业都有什么课程就业方向有哪些

2022年立秋是公老虎还是母老虎-2022年立秋是什么老虎

瓷砖美缝剂效果好不好用瓷砖美缝剂效果好不好

疗疾有茶美容亦有茶

什么是蛋白虫

iphone13|iPhone 13来了！这一次库克连路由器都要逼你换了......

完美世界介绍（完美世界简介）

acgn漫评|辉夜吃了神树果实后，首次展现白眼的力量，让羽村连眼睛都睁不开

vivo x|vivo S系列新机发布，核心性能提升次旗舰水准，1899元起步

2023巫山小升初回户籍所在地报名咨询电话

玻璃杯泡茶后怎么清洗干净

红景天哪些人不宜喝女人喝红景天的好处

疫情防控+准考证打印 2022年天津自考生考前重要通知

高通骁龙|红米再次爆发，三星E4屏+67W快充+48MP三摄，骁龙870加速离场

剑侠世界3手游平民最强职业是什么？

皮包护理用什么油