骑猪兜风

AlphaGo挑战人类《星际争霸2》:必遭暴虐

骑猪兜风 2016-06-11 07:50:18    200924 次浏览

在 AlphaGo 战胜了韩国围棋棋手李世石后,DeepMind 创始人戴密斯·哈萨比斯(Demis Hassabis)就曾表示将研究以人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸》。不过目前看来,DeepMind AI要跟人类比赛打《星际争霸》这事,还是有点儿悬。

早在2015年,DeepMind AI就开始用已经雅达利1977年发行的游戏机Atari 2600来进行游戏训练,整个训练过程团队没有提供任何额外信息帮助,全依靠AI自己来一步步学习如何打怪升级。在这些游戏里,有一款游戏始终让DeepMind AI很苦恼,那就是《Montezuma’s revenge》,这是雅达利一款难度超高的游戏。

后来团队找到了“好奇心”激励机制,来让DeepMind AI获胜。他们给AI变成编程输入“人工好奇心”,在AI探索更多的玩法的时候给予它更多的奖励,鼓励它去用不同的途径来获取更高的分数。在新版本里,DeepMind AI在好奇心的驱动下探索了15个房间的游戏。在没有好奇心的时候,它只玩了2个房间。

今年3月底,在AlphaGo五局四胜赢了李世石之后,暴雪娱乐制作总监Tim Morten就在WCS中国区总决赛上确认,DeepMind AI将挑战《星际争霸2》,当时Tim Morten就直言DeepMind AI不会在《星际争霸2》中战胜人类。直接目前,这一场人机游戏争霸战,官方都没透露更多的细节。

实际上,《星际争霸》作为一款即时战略类的游戏,给 DeepMind 的挑战比围棋更大。单单是对战局面的数据获取方面,两者就相差巨大。围棋棋盘上就只有数量不等的黑白两色棋子作为数据,而游戏中则包括了双方兵力数量、兵种构成、能力属性、时间等等等。另外作为即时战略游戏,《星际争霸》需要在极短时间内执行策略,而围棋相对来说则有充足的时间给AI运算思考。

目前,DeepMind AI想要打赢《星际争霸》 还是需要更长的时间学习和摸索。

AlphaGo挑战人类《星际争霸2》:必遭暴虐

内容加载中