游客

Facebook AI负责人勒坤:机器可以通过观察掌握常识

游客 2017-03-10 12:09:53    200862 次浏览

Facebook AI负责人勒坤:机器可以通过观察掌握常识

Facebook 人工智能研究部门主管严·勒坤接受外媒采访时表示,机器视觉的下一个领域是让软件单纯通过观察世界来学习知识,甚至掌握常识。

以下为原文内容:

5 年前,软件的图片识别能力突然取得重大进步。它背后的人工神经网络也奠定了最近这股人工智能浪潮的基础。正是得益于这项技术,谷歌和 Facebook 现在才能让你搜索自己的照片,并由此催生了许多全新的面部识别应用。

Facebook 人工智能研究部门主管、纽约大学教授严·勒坤(Yann LeCun)就参与开辟了机器视觉的神经网络应用。他表示,这一领域仍在取得进步,甚至可以催生具备常识的软件系统。

Facebook AI负责人勒坤:机器可以通过观察掌握常识

Facebook 人工智能研究部门主管、纽约大学教授严·勒坤(Yann LeCun)

问:现在的机器视觉有多好?

答:如果一张照片里有一个占据主导的物体,要求机器对这个物体进行归类,效果会很好。只要有足够的数据,大约每个类别有 1000 个样本,便可识别出某个品牌的汽车,或者某个品种的植物或狗。我们还能识别更加抽象的类别,例如某张照片的内容是景观、日落、婚礼还是生日聚会。即使在 5 年前,也无法明确这些问题能否完全解决。但这并不意味着机器视觉问题已经解决。

问:还有哪个重要问题尚未“解决”?

答:多年以来,人们一直希望能给图片添加注释,给视频增加字幕。表面看来,已经有了一些效果极佳的演示,但实际效果并没有那么好。这些系统的能力很有局限,只能针对经过训练的特定领域展开。对于多数系统而言,如果你向其展示其他类型的照片,或者它们从没见过的异常环境,它们就会完全抓瞎。它们并不具备常识。

问:视觉与常识之间有什么关系?

答:这取决于你的沟通对象——即便在 Facebook 内部,人们对此也持有不同态度。你可以完全用语言跟一套智能系统互动。问题在于,语言是个低带宽渠道。很多信息之所以通过语言传递,是因为人类有很多背景知识来解决这些信息。

其他人则认为,为人工智能提供充足信息的唯一方式就是为其赋予视觉感知能力,这样获取的信息远多于语言。如果你告诉机器,“这是一台智能手机”,“这是一台压路机”,“有地东西能推动,有的东西推不动”,那么机器便可对世界的运行方式有一个基本的了解。就像婴儿的学习过程一样。

问:但婴儿无需明确指令便可吸收很多信息。

答:我们真正希望做的一件事情是,让机器可以仅仅通过视频或其他渠道了解许多事实,从而明白现实世界的局限。它们最终便可借此了解常识。婴儿和动物刚生下来的头几个月都会了解这些事情——他们会单纯通过观察学习大量信息。现在有很多方式可以轻而易举地骗过机器,因为他们对世界的了解非常有限。

问:具体到让软件通过观察来学习这件事情,目前取得了哪些进展?

答:我们很感兴趣的一个想法是:一套学习系统应该具备预测未来的能力。你给它展示几帧视频,它就会预测接下来发生什么。如果我们能够训练一套系统做到这一点,便可开发出无监督学习系统的底层技术。在我看来,到那个阶段就有可能出现很多有趣的事情。这种应用未必在于视觉领域——但我们在推进人工智能进步时,有很多努力都着眼于这一方面。

内容加载中