通过开发出一款能够在任务中不断学习的人工智能程序,研究人员已克服了人工智能的主要障碍之一。
由谷歌旗下人工智能公司 DeepMind 开发的这款程序,已经完成了一系列不同的任务,且表现的几乎像人类一样出色。更为重要和独特的是,这个人工智能程序不会忘记先前解决问题的方法,能够使用学习到的知识解决新问题。
在遇到新挑战时,目前的人工智能就无法发挥出人类的一般智力,且它对过去课程的使用更为有限。但如果研究人员想要开发与人类智力匹敌的强人工智能(Artificial General Intelligence)机器,就必须得解决人工智能无法发挥出人类一般智力的问题。
“如果我们有更聪明、更有用的电脑程序,那么它们就必须得有按顺序学习的能力,”DeepMind 的研究人员詹姆斯·柯克帕特里克(James Kirkpatrick)表示。
对人类而言,牢记旧技能并把它应用到新任务是很自然的事情。一个经常滑旱冰的人很快便能掌握溜冰的技巧,因为一种技能能够帮助其它的技能。但是对人工智能研究人员来说,把这种能力植入到计算机当中的难度相当大。人工智能程序通常只能针对一个任务,仅仅是一个任务。
这个问题的出现是因为人工智能倚重工作的方式。绝大多数的人工智能是基于称为神经网络的程序,经过无数次的试验和错误,学习如何执行如下棋、打扑克等任务。一旦训练神经网络下棋,它只有在覆盖了学习到的博弈技巧之后才能学习其它游戏的技巧。这也被人工智能研究人员称为“毁灭性的遗忘。”
如果不具备在一个技巧之上掌握另一个技巧的能力,人工智能就永远无法像人类一样,或是有足够的灵活性去解决人类能够解决的新问题。“人类和动物会一个问题接着一个问题的学习,这是建立在他们以前所学知识的基础之上、让他们不断学习的关键因素,”柯克帕特里克说。
为了开发新型人工智能,研究人员借鉴了神经科学的研究成果,它表明动物在不断学习的同时,会在大脑中保留过去所学的重要技能。对于动物的生存而言,通过躲避捕食者学到的经验至关重要。如果老鼠寻找食物的技能被抹去,那么它就不会长时间的生存。
DeepMind 的人工智能用简单的方式借鉴了大脑学习的状态。当它从一个任务转向另一个任务时,它会计算出在神经网络中的哪个连接对已学到的任务最为重要。然后在学习下一个技能时,很难对已学内容进行改变。“当网络能够再利用已学到的知识时,它会这样做,”柯克帕特里克说。
研究人员让人工智能随机玩 10 款经典的 Atari 游戏。他们发现,在每款游戏上花费数天之后,人工智能在 7 款游戏中的表现已同人类玩家相同。如果不采用新记忆巩固法,人工智能只能玩其中的一款游戏。
在观察人工智能玩游戏的过程中,科学家们发现了一些有趣的策略。举例来说,当人工智能玩赛车游戏 Enduro 时,它会把夜间、白天、雪地等环境当作是不同的任务来对待。
研究人员在在国际权威综合学术期刊《美国科学院院报》(Proceedings of the National Academy of Sciences of the United States of America, PNAS)发表的论文中,详细描述了新人工智能如何使用过去学到的经验来解决问题。不过目前尚不清楚使用过去的经验能否让人工智能表现的更加优异。虽然 DeepMind 开发的人工智能程序能够玩不同的游戏,但技术却没有像专用的人工智能那样出色。“我们已经证明它可以按顺序学习任务,但我们没有
表明因为按顺序学习它就能变得更好,它依然有改进的空间,”柯克帕特里克说。
“我们知道连续学习非常重要,但我们还没有进入展示人类和动物利用所学能够做些什么的下一个阶段。这仍需要很长的路要走,但我们知道它是无法逾越的障碍,”柯克帕特里克说。“多用途人工智能的发展仍需要很长时间,该领域仍有许多的挑战未得到解决。其中的难题之一是建立能够学习处理新任务和挑战的系统,同时保留已经学会的能力。这项研究目前仍处于初期,它能够及时帮助我们建立问题--解决系统,从而更灵活,更有效地学习。”
西英格兰大学布里斯托尔机器人实验室教授艾伦·温菲尔德(Alan Winfield)就此表示,DeepMind 的工作“令人惊讶”,但补充说:“我不认为它能够让我们更接近强人工智能,因为这项研究并未向我们表明人工智能如何把学习到的经验应用到另一项任务当中。”