新浪科技 余一
在1月17日召开的未来论坛2016年会上,执行副总裁沈向洋接受新浪科技独家专访时表示,人工智能目前在四五岁的小孩子阶段,但在感知方面进展已经非常快,预计4年左右时间,语音理解可以达到和十五六岁人类相同的地步,视觉理解或许会发展地更快。
今年是《爱因斯坦相对论》100年,今年也正好是计算机识别50年。人工智能在刚出现的时候,当时人们认为很快会有成果出来,但最终二三十年里都没有特别多的成果,人工智能也整体进入了寒冬的状态。
一直到最近5年,人工智能才重新火热起来。沈向洋认为人工智能之所以能有现在这么的进步,和整个计算机行业发展到现在,大数据、大计算加上一些精准的算法都有着很大关系。
“其中最了不起的一个事情就是深度学习,因为深度学习,人工智能在视觉和听觉上才取得真正突破,语音误差与视觉识别误差率急剧下降,都是基于深度学习。”沈向洋说。
据他介绍,目前微软在视觉识别方面,误差已经降到3.5%的水平。 一张图片,计算机可以识别出图片中有没有猫、有没有一只狗,是哪一品种的猫或狗,从这个角度而言,现在计算机比人做得都好。
但同时,他也非常清晰地告诉新浪科技,“如果觉得看了这样的结果以后,就会觉得人工智能已经差不了,就有一点天真了”。
人工智能是由感知和认知两方面组成,沈向洋解释说,目前人工智能只是在一部分有很大的进步,在视觉和听觉之外的嗅觉等其他感知和认知方面,目前进展是非常有限。
对于人工智能创业,他觉得最近几年是几十年来最好的创业时期,但是大家需要把几个问题分一分。感知这边,最近进展很快,当然要大力做进去,越做越好。但是也需要开始要做更多认知的问题,再继续往上走,像脑科学连在一起的问题等等。

以下为部分采访实录:
新浪科技:目前而言,人工智能整体进展如何?
沈向洋:人工智能分成两个部分,一部分叫做感知,一部分叫做认知,人工智能都是在学人类,比如讲视觉、听觉、触觉其他的一些感觉,就是人体的一些感觉,这些方面,最近因为数据越来越多,运算量可以处理很多,进展非常大。但是在认知方面,我们的理解和进展是非常有限,认知包括比如讲自然语言方面,自然语言方面的一些理解,就没有因为深度学习而很快的有太大的进展,虽然我们在做很多东西。
比如讲一张图片,图片里面可以问说,你里面有没有猫、有没有一只狗,是哪一种狗,现在计算机比人做得都好,但是这张图到底啥意思,它是不知道的。
新浪科技:如果以人的年龄作为一个评判依据,现在人工智能几岁?“看懂”和“听懂”能发展到什么程度?
沈向洋:我觉得还是小孩子阶段,大家都觉得四五岁,大概也可以认识一些东西这样的。而且我觉得这样讲稍微有点难讲,有些地方比小孩厉害。今天下象棋已经可以下过人类了,你是不是说超过50岁的人,但是有些东西远远不够,特别是认知这里,今天还没有一个很好的模型,没有很好的理论。
感知方面这几年进展的非常的快,即使到三四年前,都会说这个计算机听不懂。我们预计再需要4年左右时间,语音的理解,可以和人类相同,跟十五六岁的人差不多,就不是说四五岁的人差不多。所以我自己觉得像语音这一块,今天已经超过小孩的理解,但是它的问题是机器和人类非常不一样,人听错的话,他不会大错。机器听错就是大错,大错的原因就是后面的模型。
就像我们讲,你知道你知道什么,你知道你不知道什么,你不知道你知道什么,你不知道你不知道什么,这个问题难就难在这里。
视觉我是充满信心。我自己做了一辈子视觉,我做了25年视觉,今天看到这样的结果目瞪口呆,我在公司跟大家开玩笑,我一辈子做技术,一直做研究,但是9年前被赶出研究院做产品,所以我就有很多年没有认真做计算机识别,早知道这样,怎么也不做其他方面,就好好做计算机识别。
新浪科技:除了视觉和听觉外,人工智能的其它方面发展怎么样了?
沈向洋:除了语音和视觉以外,其他方面的进展也没有那么大,对传感技术的研究,最近也没有新材料的突破,但是大家很努力在去做。
在语音和视觉、照片也好、视频也好,大家看到有巨大的应用,除了我们在大的科研机构做这样的技术以外,大家看到很多商业的用处。上次谁跟我讲,说现在中国做视觉的公司说都是你的徒子徒孙,都是原来在实习过、工作过的,包括Face ,包括易途科技,那些都是原来在微软亚洲研究院学习工作过的一些人出去的,有很多这样的应用。但是大的核心技术,大家也是非常努力的在研究。
我觉得很多这样的技术,核心的东西都应该放出去,我最近在微软推一个大的项目叫牛津计划,以前我们出过一个测年龄的网站,也出过一个测你和另外一个人看起来是不是很相像的网站,这些东西都是小的应用而已,真正的核心技术是计算机识别的算法,现在放出去,我就提了两个口号,一个就是让你的数据更加智能;另外一方面是让大家都可以有这样的机会,可以运用这样的技术。
新浪科技:人工智能还需要多久成熟?目前人工智能各种创业方向,都是集中于听觉和视觉这两个方面,还需要哪些方面的突破?
沈向洋:前几天我在诺贝尔奖颁奖典礼的礼拜,瑞典他们弄了一个诺贝尔周,就请了一些人讲人工智能的未来,他就强迫大家问说,哪一天人工智能就能够取代人类智能,哪一天人类的智能更强了,就没有一个人敢讲是10年、20年、50年,但是事实上这个趋势已经非常快。
人工智能向前走,下一步是很多脑科学的问题,因为人类的智能里面,我们之所以今天有这样的智慧,那是几百万、几千年进化到今天这样的地步,所以跟脑的结构,脑里面怎么样做处理这些东西都连在一起。
我自己看到是几十年来最好的时期,大家这么多人有兴趣做是真正的,但是要把几个问题分一分。你首先要在感知这边,最近进展很快,当然要大力做进去,越做越好,开始要做更多认知的问题,再继续往上走,像脑科学连在一起的问题。