游客

阿里华先胜问依图朱珑,“ 万一阿里云免费了,你怎么办?”

游客 2017-04-25 09:08:45    200848 次浏览

阿里华先胜问依图朱珑,“ 万一阿里云免费了,你怎么办?”

在人工智能的赛道上,初创公司总是免不了要与大公司竞争。万一有数据、有人、有钱的大公司要免费了,初创公司的日子还好过么?

这个经常在行业内被提出的问题,也出现在了 2017 年的绿公司年会上。问这个问题的人是阿里巴巴集团人工智能研究机构的资深总监华先胜,而回答这个问题的是则是计算机视觉初创公司依图的 CEO 朱珑。

“ 万一阿里云免费了,你怎么办?” 类似这样的问题我们也很感兴趣,于是也对对话中一些有意思的部分进行了整理。

  以下为对话整理内容

主持人:北极光邓峰

对话嘉宾:依图 CEO 朱珑;阿里巴巴集团人工智能研究机构的资深总监华先胜

现在的人工智能春天与此前两个春天有什么不一样?

主持人邓锋:请来了我们学界很资深的一个人士,是人工智能领域的,美国计算机协会 2015 年的杰出科学家,IEEE  Fellow 院士,阿里巴巴集团人工智能研究机构的资深总监华先胜,我们请华先胜来给我们朱珑一起对话。中国人工智能是一个不是很大,全球都不是很大的圈子,现在说招一个人工智能的人才,那给的工资都极高极高的,两位之前也很熟悉,华先生您听了朱珑的演讲的话,您有什么想挑战朱珑的。 

华先胜:我经常说一句话,叫人工智能风生水起,视觉计算遍地开花。刚才朱珑前面讲的更多的是视觉内容,就是这些花开了能不能结果其实是很难讲的。我们回忆一下这个人工智能的发展,人工智能其实不是一个年轻的概念,大概 60 年前 1952 年的时候提出来的,那个时候大家也非常的兴奋,十年以后人工智能就要超越人类了,大概过了十几年以后发现不行,这个人工智能不下去了,到了 80 年代的时候,因为这个神经网络的出现,而不是今天的深度学习网络,包括这个一批算法的出现,大家又很激动很激动,这个人工智能来了,又要来了,过了十几年以后又进展不下去了。那么我想问朱珑一个问题就是,这一次人工智能起来以后,我怎么能知道它不是一个虚假的春天呢?今天有什么不一样呢?

朱珑:我自己的理解,首先讲不一样的程度吧。我觉得说今天人工智能比肩或者超越工业革命毫不夸张。

很多人在谈论的时候是用了这个词汇,但实际行动上并不是这么大定义的,他实际嘴上说说,如果是这么大的,你应该把房子卖了都放进来对吧,但是实际行动是跟不上说话的这个程度,这个是讲定义的程度。

第二个事情跟以前不一样,以前讲的概念,或者是 30 年前人工智能比较热的时候,今天 2012 年那场会,2013 年深度学习热起来,深度学习我在那个实验室待着,就是刚才说了很多科学家或者是年轻人并不爱学这个,它是一个冷门。

概念其实在那里躺着,已经躺了超过 10 年时间,算法和模型并没有本质的变化,今天热起来是从结果来说的,是所有的领域的结果让大家感觉到信心,比如谷歌把钱给砸下去了。以前的热是说有钱人跑到 MIT 说,听说你在做脑科学,1000 万美金给你,我们一定要参与一下这种脑科学计划,或者是飞跃计划,能不能做成。

今天是因为商业价值,看到了商业巨大的进展,这跟过去十年、过去 30 年所有的热门的东西,不仅是概念,是在实验数据上,工业级的实验数据上看到非常深远,或者说这种科学意义上的统计意义上的,我觉得这是最重要的不同。

万一阿里云免费了,创业公司怎么办?

华先胜:OK,这个我觉得是有道理的,跟以前不一样了,我们现在看到了一些结果,尽管我们看到的结果其实也是一个局部的,当然还有这个关于深度学习技术真正在大规模的计算环境下能够计算,这个深度学习技术的发展,计算能力的提升,网络的提升,网络带宽的提升,数据产生的容易,包括这个用户的参与,用户的参与本身就是一个强的反馈,是看到的成果可能会更向前发展,真正产生作用。

那么第二个问题是想问问你这家创业公司,视觉技术,因为我本身也是做视觉技术的,在高手之间,算法的差别几乎是越来越小,对于数据而言一家创业公司跟 BAT 相比好象也毫无优势,从计算平台的角度来讲小公司更没有计算平台了,阿里云有计算平台,谷歌、百度,百度有没有不好说,至少微软这些公司都有大的计算平台。从商业的角度来讲,创业公司跟这些公司比商业也是很难比的,那么怎么样让一个创业公司在这里面能够胜出呢?我打一个比方,假如有一天,微软、阿里云免费了,这些技术免费了,大家注意媒体同事请注意,我没有说阿里云免费我只是打一个比方,不然我回去就被炒了,假如有一天这些大公司免费了,你怎么办呢? 

朱珑:这个问题在我创业的第一天就被问过。因为我自己的身份还是有一定的立场能讲这句话,什么意思呢?我在全球最好的人工智能实验室待过,所以我天生回来的时候就很平静的。有人问我,问百度就是问谷歌说做的怎么怎么样,我知道我师弟几斤几两在那边做的,不是因为谷歌强他就牛逼了,这是由做人工智能领域最强的那个人决定的。 

有数据有钱,1 亿美金给他,他会做成不见的,这个差很远的,但我这个观点不代表是为所有的创业者说话,而是说,这个事情的本质是由最强的那个人决定的,大的公司之间的博奕,微软和谷歌之间谁有那 1 亿美金呀,大家都有,现在创业公司 1 亿美金都很轻松,钱也不是问题。 

资源、数据、都有钱,你说大的公司敢投 1 亿美金吗?找不到那个人的时候,有钱也不敢投。

主持人:刚才我理解,听出点火药味来了,我们这儿人还是很牛,但是数据是关键,人家比你数据多。

朱珑:首先数据是非常关键的,但是这里谈技术的时候,我经常被同事们问。技术有几个层次,其中有一个叫做技术的远见或者技术的 insight,大家是不谈的,大家只是谈算法,远见是什么意思呢?

技术未来在哪里,就是说其实技术的理解能够知道数据在哪里,继续值钱到哪里,这不是大公司就一定知道的,大公司太多了,你看 BAT 跟谷歌对数据的理解还千差万别,他敢投这个人工智能科学家,敢投 5000 人 3000 人下去,BAT 是不敢投这么多人的,他不知道 business 在哪里,也不知道技术的预测。其实最一流的高手他差距就是非常大的,最牛的人之间反而有可能是差距越来越大。 

创业公司有数据的瓶颈,四、五年前数据是约束我们的,这个倒是真的。但还要看你要进入哪个市场,比如医疗市场,医疗是一个非常分割的市场,今天没有哪个大公司把这个数据通吃或者垄断了。

哪一些市场是特殊的?有用户场景的。有大量用户场景是大公司的强优势,我觉得小公司基本没戏,既使是你有技术。这要区分来看,有一些领域,比如说人脸,大家都做人脸识别,那用网络上的数据,其实大公司小公司都没有太大差异,都能收集到 1 亿、2 亿的数据,但是到比如刚才说的 ATM 机刷脸取款的那些场景,既使是非常大众化的人脸识别这个领域,BAT 也没有 ATM 机的数据,你也得从最简单的开始做起。越垂直、越分散的领域,大公司不见得有优势,这是创业公司很大的机会。

人工智能的发展对将来会不会产生负面影响?

华先胜:看来你对于自己的科学家的团队还是很有信心的,实际上我觉得大家都知道这个智能的发展,人工智能这个技术落地确实是有很多的因素在里面,有科学家,或者叫算法,算法是由科学家发明的,所以我把他混在一起来谈,有数据,有平台,有商业模式,有用户,这些因素基本上是缺一不可的,他可能应用强调这部分更多一点,有一些应用可能强调另外一个因素更多一点,其实我有些同意刚才朱珑的一些看法,特别是讲到要深入一个行业去,我觉得是非常重要的。人工智能远远还没有到我想到一个算法然后就 work,不是这样的。还差的远的很。

第三个问题,刚才讲到很多监控的问题,智能的发展对将来会不会产生一些负面的影响?比如安全方面,隐私方面,这些将来带来的问题,带来的困扰。就相当于计算机发展的过程当中刚开始 PC 的时候有病毒,后来网络有木马,现在数据和 web2.0、3.0 等等这些概念出来,假新闻等等之类的都会带来负面的一些因素。我想问一下,虽然跟你的创业公司不见得有直接相关,我想问一下你在这方面有什么样的看法。

朱珑:技术带来的社会影响其实是一个长久的话题,人工智能可能今天因为超越人的智能边界的时候,会更加敏感。我觉得两个方面,第一个方面就是它其实不是安全问题,或者不止是安全的问题。“智能”大了之后的社会分工,我觉得十年之内有巨大的动荡,不仅是中国,全世界都会面临这个问题。我为什么是我?我大学上了到底有没有用?大家如果家里有小孩,今天可以开始思考到底学什么。这个课题在过去的教育学家的课题可能这一页应该翻过去了,要重新开始思考。 

没有人是特别知道应对 30 年后的世界,现在学什么才是对的,因为今天我们开始重新认识自己。未来 20 年,人类社会分工,或者经济形态会有巨大的变化。以前大家都学车,那以后无人车都有了,你学车就被人笑话对不对。

第一个层面是说,这个会有非常不平衡的情况出现,而且政府一定是滞后的,因为这个时间越长,没有人有特别强的预测能力和管控能力,所以这是第一个层面。

第二个事情是,目前 AI 技术并没有跟其他的互联网技术,或者是其他信息技术在安全性上,或者是其他层面上带来的威胁有本质的区别。技术都有两面性,一定会出现有利的地方和不利的地方,在过去因为有黑客互联网就不发展了?不太可能。我觉得 AI 并没有特别强的特殊性。

华先胜:刚才朱珑讲到了一个非常有意思的关于人脸识别技术,机器识别的能力,但是其实还有另外一点,机器识别的局限性。比如我们对一个人的时候,哪怕这个人的侧面,哪怕是一个背影,哪怕是灯光灰暗的,哪怕是有人遮挡的,人是能够识别的,机器很多情况下就歇菜了,也就是说这个机器是在某一个方面是强的,在某一方面是弱的。

比如说,现在还有一个例子就是对话这件事,你在某一个行业里面,或者说你只是问他一些,告诉它订机票,查天气,叫个车,那是很好的,你要随便跟他聊聊天,说这个北京天气怎么样,饭馆怎么样,或者是杭州呢?它就说杭州有美丽的西湖,就不知道你的联系到说杭州的天气怎么样。那么人工智能的局限会不会限制将来的发展?到底怎么样结合人的智能和机器的智能的这个长处去产生真正的影响?

朱珑:刚才这个问题也比较一般难见到。我本来给大家解释那条曲线,稍微有点复杂,我刚才跳过去了。那条曲线,横轴是不同的年限,纵轴是错误率,大概是这么一条下滑的曲线,曲线上不同的点是什么呢?就是每一万人当中把你识别出来超过 95% 的这种点,再往下一个点就是 1000 万,100 万人 1000 万人,1 亿人,10 亿人。技术是这样子发展的,什么意思?

刚才 1 万人、10 万人对应的是算法的识别性能,也是对应算法适用的场景性能在 10 倍、10 倍的提高。场景是不断被解锁的,而且这个过程是一个非常大非常大的加速的过程。

过去我们很难想象 ATM 机这种边界是可以做的,实际的应用场景有的时候是超越你想象的。我们是业界最前沿的,有时候都会受到惊讶,举个例子,警察拿着人脸识别去辨认尸体,这不是设计者最初能够设计到的,我也不是这么弄的,警察说这个也可以,尸体不知道身份,他就可以查出来。他应用于这个事情的时候,大大超越设计者的想象。今天的智能,我们的想象已经跟不上人工智能发展的速度了,所以千万不要担心人工智能还做不到你刚才说的那些事情。

华先胜:我举一个例子,你虽然做的很准,但是你很难应用。拿医学图像处理来说,大家知道照X光,或者是各种各样的 CT,MRI,你可能有很多东西,如果你的影象科医生是很好的,医生他看的比较准,不好的医师可能看不好,经验不丰富看不了那么准。人工智能来做非常好,现在这个准确率也有提高,但是问题在哪儿呢?因为我们用了深度学习的方法,导致什么呢?他看的图片以后,他可能看了几百万的图片,其中有可能有几十万是病人,他就告诉你这个可能是有癌症,或者说准确率多高有癌症,但是他解释不出来为什么。你要给到这个临床医生他给你看,他说,你这个左胸和右胸的这个纹理不够清晰,或者是哪儿不够清晰,结节的形状,结节的大小等等,他会说一些这个东西,可是人工智能给你回答的只是说你这个疑似癌症。这怎么在实际当中用?你没法跟病人解释怎么办?

朱珑:我来解释一下,刚刚那个片子可能大家没有细节看,我没有展开。我刚才有一个 CT 的片子,我们出的报告恰恰是你说的,里面对结节的大小,它的体积、可疑性等都有描述,我们会出病理报告,就是诊断报告,医生只要在这个病理报告上做一些诊断。就是说它是可以被解读、可以跟医生交流的,他是做一个描述性的东西,不是只回答患癌或健康。

主持人邓锋:你已经不是简单的深度学习了,你已经走到结合其他的东西来做的方向了。

朱珑:可以这么说吧。刚才说的问题是有一部分存在的,甚至是大部分存在的。时间就是 2017 年比 2016 年快太多,2016 年比 2015 年快太多。

我举一个例子,2016 年我们的产品能够被部署到医院,就用了半年时间。在公安系统同样的这个事情我做了两年半的时间。

就是说技术在商业化落地的过程,商业跟技术结合的过程越来越加速。当然这个可能是我们一家公司的特例,或者说不是现在市面上的公司都这样,但我觉得总体趋势是这样的。

主持人邓锋:加速是最恐怖的一个事儿。

内容加载中