这绝对不是AI第一次在游戏中击败人类,AI最近成为了职业扑克玩家和世界顶级围棋玩家Lee Sedol。但是,这次有所不同,因为比赛是在更加复杂的游戏环境中举行的。
最近,来自OpenAI的十几名研究人员一直专注于允许智能代理像人一样使用虚拟键盘和鼠标的计算机的研究领域。他们甚至发布了一个名为Universe的开源项目,允许任何人在世界范围内培训游戏和其他应用程序的AI代理。他们的研究成果是在国际dota 2锦标赛的主要舞台上进行的,这是世界上最大的体育赛事之一。正如研究人员团队提到的那样,机器人只需要一个小时的培训,就可以学习支配内置游戏机器人的必要技能。并且花了两周的时间实时学习才能击败顶级人类玩家。
“在过去的一周里,我们的机器人在许多顶级专业人士的比赛中不败,包括SumaiL (世界顶级1v1玩家) 和Arteezy (世界顶级整体玩家),” 机器人的创建者在他们的博客上说。Isshutin还提到了机器人在做出某些关键决策时是如何毫不犹豫的,而大多数人类参与者通常会这样做-这再次证明了人类决策过程中的波动性。
“他的动作很疯狂,我真的很紧张。…好的。我放弃了,他太强壮了,”伊苏丁在游戏中说道。
那么,为什么这很重要,与以前的AI击败围棋冠军相比如何?多人在线战斗竞技场游戏 (MOBA) 通常比具有所谓完美信息的游戏复杂得多,在游戏中,玩家会被告知游戏中发生的一切。国际象棋和围棋是具有完美信息的游戏示例,因为每个玩家都可以充分了解棋盘上的所有ps。与国际象棋相比,Dota等游戏的电子竞技游戏通常包含大量隐藏信息。这就是为什么智能游戏代理必须学会适应,创造攻击和技巧的策略,甚至学会欺骗对手的能力。
正如OpenAI所说,其机器人每分钟动作之间的相关性与普通人类玩家的相关性相当,这意味着对游戏来说重要的不是快速执行的能力,而是技能。
这就是为什么OpenAI的胜利立即受到该倡议的主要支持者之一埃隆·马斯克 (Elon Musk) 的称赞,这是一项比Google DeepMind在古代围棋比赛中的胜利更大的成就。
OpenAI首次在竞争性电子竞技中击败世界上最好的球员。比国际象棋和围棋等传统棋盘游戏复杂得多。
-埃隆·马斯克 (@ 埃隆·马斯克) 2017年8月12日大公司越来越有兴趣在游戏环境中尝试人工智能。DeepMind最近宣布了与暴雪的合作伙伴关系,暴雪是广受欢迎的星际争霸游戏的创造者。他们介绍了一种训练星际争霸机器人的新方法,并发布了一份联合研究论文,其中概述了强化学习应用程序的游戏环境。
这类研究的目标是在不同的游戏环境中训练智能代理,因为它们比典型的研究问题复杂得多,并且通常包含多个子目标,这使得构建智能变得更加困难。这就是为什么这些环境可能真的会突破研究的界限,改变我们认为人工智能从长远来看可能实现的目标。
版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“融道中国”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场。
延伸阅读
版权所有:融道中国