AlphaGO与李世石一战成名,其背后的谷歌DeepMind人工智能团队也走到世人面前。据外媒报道,DeepMind的最新AI已经掌握了超高难度的雅达利游戏《Montezuma’s revenge》,表现让人咋舌。
据了解,在AlphaGO之前,DeepMind都是用雅达利的游戏来自测AI。老版本的AI在《Montezuma’s revenge》中表现一般,但经过长时间的学习、试错之后,新版本的AI已经掌握了该游戏的大师级技巧。
现在,它可以像人类一样,躲避、拾取要是,并努力取得更高分。而且整个学习过程没有通过任何捷径,完全是AI自学。
此外,DeepMind还为新版AI增加了一种“好奇心”激励机制,趋势AI获得更高分,并因此获得回报。
据悉,老版本的AI在游戏中仅仅探索了2间游戏房间,而新版本的AI由于新的驱动机制,探索了15间游戏房间。