游客

国际信标委专家: 人工智能最终会被函数化

游客 2017-07-01 05:53:18    201163 次浏览

■本报记者 商灏 北京报道

人工智能越来越热,正在大连举行的第十一届夏季达沃斯论坛,也将其列入核心话题——以人工智能为主要特征的第四次工业革命怎样确保整个经济包容性增长?这一会议主题引起很多关注、讨论。而当下与之相关的更深入的热门话题是,人工智能未来将如何影响社会进步和产业发展?快速扩张的中国人工智能产业如何成为推动经济健康发展的强大稳定的潮流?刚刚回国的代表中国出席上周在日本东京举行的国际信标委全会的国际信标委协调员、柏睿数据董事长刘睿民,在接受《华夏时报》记者专访时表示,人工智能其实与物联网的发展,与数据处理技术的发展密切相关,其最基础的东西是庞大的数据量,是数据库技术,是机器学习的算法。刘睿民说,人工智能产业发展的背后,其实是一种博弈,各有关国家技术水平都差不多,某些技术项下中国还有超前,尤其在内存全并行数据库运用上。但技术的发展是一个持续的过程,你若不往前走,别人继续前行就要超过你。

2016年国际信标委美国孟菲斯 “ISO/IEC JTC1/SC32数据管理与交换”分技术委员会全会上,刘睿民代表中国提交的有关“SQL 对 MapReduce 及与之相关的流数据处理的支持”的流数据库技术标准提案,获正式立项。刘睿民说,立项以后,这个标准里到底应含哪些东西,大家会先把想法说出来形成草案,再进行讨论和修改,而讨论和修改则是个博弈过程,刘睿民说,如果按既定方向走,中国这一提案在2018年获得国际信标委全会通过后将正式成为国际标准。

关于人工智能未来发展趋势,刘睿民说,这次在日本举行的国际信标委全会上,他提出了“人工智能最终会被函数化”的推论。

 人工智能最终会被函数化

《华夏时报》:人工智能大热之时,与其相关之技术,包括大数据、机器学习方面,诸多问题如何看清?

刘睿民:人工智能最关键处在于其算法。人工智能算法上世纪70年代即已有之,只因当时数据量不够,难有用武之地。而今有了机器学习,方可大显身手。机器学习通常分四大类、三十多种算法,比较好用者,大约三到五种,在不同领域均有用之。其深入应用,只要数据量足够,特性表现令人满意。人工智能应用,归根到底,就是机器学习算法。

人工智能应用兴起,还因现今物联网相对成熟,大量数据沉淀下来,瞬间数据被采集下来。而以之进行决策,须基于统计算法,基于统计学之精算,例如蒙特卡罗树搜索(Monte Carlo Tree Search,一种人工智能问题中做出最优决策的方法,一般是在组合博弈中的行动规划形式。它结合了随机模拟的一般性和树搜索的准确性)的应用。所谓人工智能,究其实质,无非一些算法应用而已。迄今为止,所有这些算法理论基础并没有发生改变。只是现在人工智能应用所基于数据量比以前要大得多,以前可能是有70万条数据,现在却可能是有70万亿条数据,算出来的东西当然更加精准、更加接近现实,某种程度上就更接近人工智能的定义。

《华夏时报》:有无可能出现新一轮人工智能算法的突破?

刘睿民:到现在为止,算法理论上并没有突破,只是说原来的理论相对比较超前被用了。

《华夏时报》:流数据库技术标准和现在热炒的人工智能概念有何关联?

刘睿民:流数据库主要跟物联网有关,物联网里大量数据出来以后,基本上就跟人工智能应用有关。什么叫物联网?比如自动驾驶就是物联网。各种传感器经过扫描,把数据送到后端进行处理,这就叫物联网。人工智能应用范围很广,同时它在各个行业里又有各自的特异性。比如语言翻译是人工智能,智能驾驶又是另外一种应用领域,这两者一样吗?完全不一样。下棋也是另外一种应用领域。所以,怎样将各领域的东西抽象出来,变成函数、变成通用的基础设施,这类似于以数据库为基础设施,提供一个标准接口,以此标准接口提供标准服务,这是关键。

这次在东京举行的国际信标委全会上,我提出了“人工智能最终会被函数化”的推论。以前的函数都是取平均值、取最大值、取最小值、取delta(复数),差异项,——类似这种简单计算。以后的函数就不是了,以后可能从前面采集一坨数,经过人工智能算出来则可能是某一决策的几个要点,决策者看到这几个要点,可能会选一条路径往下走,最后就变成一个复杂函数了。

《华夏时报》:从人工智能未来来看,推动人工智能迅速发展的三个主导因素:大数据的爆发、算力的普及和提升、行业的应用需求,它们还会有更深入的发展,就是你所说的算法更加复杂、数据更加丰富?

刘睿民:对,就是这样。过去数据量不够,且数据分布非常离散,没有代表性,从中看不到任何规律,因此算法根本用不起来。一旦数据量大了以后,数据的分布就会有一定的关联性。在物联网情境下,大量数据都会被采集下来,就好像我们戴的电子腕表这类智能硬件,一秒钟对人心跳的检测有2-3次,一分钟有120多次。除了心跳应用,还有走路应用、海拔应用、热量计算应用等,这些数据不断往下刷,产生极大量的新数据。类似的应用,比如智能房间、智能驾驶等,实际都是要依靠一堆采集数据的传感器。

这些应用会使算法越来越成熟。到一定阶段,就可能会变成一些固化的函数。现在大家还在探索,在哪个领域用得最好,这个算法用在ABC更好,还是用在EFG更好。但它的特性到底用在哪个行业里面?比如蒙特卡罗树搜索用在类似腕表的计算上面不见得是最好的方法,但是通过其他的算法,也许可以得到更好的结果。

 一定要把汽车砸掉的是马车

《华夏时报》:人工智能未来几个因素,大数据爆发、算法的普及提升、算力的提升、行业应用方面,未来会发展到什么程度?现在大家最热烈讨论的一个问题是,迅速发展的人工智能未来会不会真的取代人脑智能?怎么样看人机较量胜负的象征意义?人类自我认知、自我发现还会面临什么大的突破?

刘睿民:在这次国际信标委全会上,我在阐述相关问题时举了一个例子:就像开车一样,人跑得再快也不可能跑过汽车,但是奥运会径赛项目因此就没人参加了吗?

《华夏时报》:机器人有深度学习的能力,如果这一能力最终导致机器人智能超出了设计者能接受和掌控的程度,这会不会很恐怖?

刘睿民:我反倒不觉得。人工智能算法的目标更多是探索某种最佳决策路径而已。最终究竟选择哪一种最佳决策路径,确实人脑计算不过来,需要依赖更强计算力,采集和分析某一特定情境中足够大量的数据,作出可能出乎人类意料的决策或判断。

《华夏时报》:比如战争机器人,设计出来参加战斗的机器人士兵,单个可能会听从命令,一旦它可以形成自己的语言并在相互间进行交流、有思想、有谋略了,会不会形成团体战斗力,从而不再为设计它的人类服务,甚至反过来把雇佣它的人给消灭了?

刘睿民:就像过去机械诞生的时候,人类也曾很恐惧一样,一定要把汽车砸掉的是马车。

《华夏时报》:你认为机器人无论怎么样都逃不脱人类的控制?

刘睿民:逃不脱。怎么可能逃脱?除非它能造出一个数学公式,超越人类所造出的数学公式。

《华夏时报》:可是机器的深度学习能力太强大了。

刘睿民:深度学习不代表对理论的颠覆,这是两码事,它只是一个统计算法而已,只是说在某种情境下,哪些东西出现几率比较高,哪些东西出现几率比较低。A情境下出现几率比较高的那些东西分布的区域,与B和C情境下出现几率比较高的那些东西分布的区域,有什么相关性,这纯粹都是统计的结果。

《华夏时报》:机器只能识别和判断这些概率出现的大小,却并不能设计出相关的情境?

刘睿民:对,这是统计概率问题,难道统计概率能把其他的数学理论颠覆掉吗?答案一定是,不。否则这世界上就只有统计,没有别的数据分支了。

《华夏时报》:无论深度学习能力多么强大,终究它不懂得人类创造的基础理论?

刘睿民:对。

归根到底,再怎么样都是统计算法。所以我们要记住:它是从一九七几年开始的那些统计算法里所衍生出来的东西。

《华夏时报》:它自己不会像人类那样有自我发现、自我认识的能力?

刘睿民:它所谓的自我发现,只不过是在统计算法的基础上,对原有的这些统计数据集之间发生的关系进行一定的归纳。

《华夏时报》:现在投资者有意炒作人工智能这个概念,背后可能是对未来市场的争夺,但反映到深度学习和认知计算的技术竞赛方面,会不会带来什么大的变革?

刘睿民:也不能这么说,投资人有投资人的想法,因为投资是逐利的,但是投资人也不至于什么都懂,因此就有可能被忽悠,或对某些东西产生臆想,或刻意放大某些东西。

《华夏时报》:或是有意进行一些市场布局,以获得更大利益?

刘睿民:现在的投资市场更多是击鼓传花的过程,就要看最后接的人是谁了。一项新技术从诞生和发展到相对成熟阶段,都有一定规律,不是随随便便就发生了变化,发生变化需要一定的理由。机械时代发展至今,机械基本上成熟了,虽然偶尔还会出现一些突发异想的机械结构,但已经基本到顶了,制造已经变成智造,相当于要有新的东西,要有机械替代人肌肉的东西,才能够发挥更大的作用。

《华夏时报》:从人工智能到人脑研究,未来可能会面临什么样惊人的局面?

刘睿民:无非就是造出一个一个部件来替代人说话和工作。

《华夏时报》:人工智能叠加智能制造,可能会带来什么样的工业世界、社会面貌大的变化?

刘睿民:工业界的变化我相信其实会比较大,比如像智能驾驶、智能车间、黑灯工厂、智能码头,归根到底还是人利用了智能机械,让生活变得更美好。

基础理论研究

  须尽快赶上美国

《华夏时报》:人工智能方面的研究,中美差距到底有多大?

刘睿民:人工智能商业化我们走得快,国内一向都是应用做得好,体验做得好,但是扎实的基础设施、基础理论做得很糟糕。拿数据库来说,30年过去了,到底作出什么样的东西,市场上已经说明了一切。国家为此投了多少钱,肯定我是计算不出来,但这个量肯定非常大。人工智能极有可能会成为下一代基础设施建设和基础理论研究里非常重要的一个组成部分,如果我们现在不赶上,下一个30年可能就赶不上了。

《华夏时报》:人工智能产业结构方面,最重要的是技术层?

刘睿民:对,基础还是算法。

比如对算法的抽象,包括算法进一步的推演,这些东西其实我们国家是没有人做的。做,也都是放到中科院数学所这种地方去做。但是数学所的东西又可能是跟实际相脱节的。

《华夏时报》:这方面有什么好的建议?

刘睿民:以前很多做这方面研究的人,包括做数据库的一些前辈,或是在这方面有些想法的人,都曾建议在这方面有更多的投入,但其实最主要的还是要形成一个类似于硅谷的氛围。比如做自动驾驶的Elon Musk(埃隆·马斯克,1971年6月28日出生于南非的行政首都比勒陀利亚,拥有加拿大和美重国籍,企业家、工程师、慈善家,现任美国太空探索技术公司CEO兼CTO、特斯拉公司CEO兼产品架构师、董事会主席),火箭飞上去掉了也不止一次了,但是允许他失败。

这个“允许失败”里面蕴含着很多东西。比如在他失败以后,怎么通过市场行为解决相关问题?国家能否出一些政策配合去解决问题?这其实是让那些勇于尝试的人,尤其对那些在智能制造的基础设施、人工智能的基础设施方面做探索的人,再去探索。如果摔在坑里爬不出来,怎么去做第二次探索?

《华夏时报》:鼓励研究人员大胆尝试、探索。

刘睿民:尝试了以后,要解决他的后顾之忧,解决不了后顾之忧,尝试完了,已经没有能力再尝试了。

《华夏时报》:所以美国在相关方面的理论研究仍然遥遥领先?

刘睿民:对。为什么我大概一年有两到三个月会在硅谷,某种程度上是去“呼吸新鲜空气”。中国其实也很市场化,但市场化以后导致大家只盯着应用、只想着挣钱。为什么很多应用型的东西都出在中国,O2O、ofo(共享单车),这些没什么技术门槛的应用,我们很在行,为什么?因为傻钱很容易进去,只要能把这个棒接下去,这事就能干下去。但是做人工智能基础研究不是这样,可能并不需要太多人,也不需要造几百万辆自行车的简单劳动,但却要做算法研究的人,也需要将算法成功地应用于一些商业领域。

这次国际信标委全会的主席跟我的导师居然还是故交,他说,当初年轻的时候做过的一个案例,是自动仓库。——现在他已经70岁了。也就是说美国在一九六几年的时候,已经在自动仓库上做了很多探索,形成了在自动仓库方面一些隐形的小巨人。由此来看,我们要培养一些个头很大的类似BAT这样的大巨人,是不是也要培养一堆散落在各个领域里的小巨人?答案是肯定的,小巨人应该越多越好。

《华夏时报》:小巨人这个概念很好。回到大数据方面,大数据应该就是为人工智能而生的,为什么说大数据和人工智能结合,就能够发挥很大的能量?

刘睿民:最关键就是原来基于统计的这些算法,最后提炼出来的人工智能的算法,其实需要大量数据。这是一个循环往复的过程。技术的推动,导致了大量数据的产生,同时促进了算法的提升和其在各领域的应用;算法的提升,又使得大量的数据同时产生,对数据搬运的要求也进一步提升;因为会产生延迟,所以对硬件的发展又产生促进,硬件要更上一层楼。——所以,这本身是一个技术推进的过程。

《华夏时报》:国内这两年已经有一些这方面所谓的科技领导者,包括BAT在内。怎么评价他们的贡献?

刘睿民:应该说在应用领域用的比较透彻,但是中国基本上在这个领域所谓的领导者,待风潮过去会怎么样,就要到时候再看了。

应用到一定程度以后,如果基础的东西不跟上,就会有后顾之忧。

《华夏时报》:柏睿这样的公司,在业内算是技术先锋公司,怎样看它对人工智能产生的影响力或其所做的一些市场布局?

刘睿民:我们看好人工智能算法是基于统计算法,看好统计算法的函数化在数据库层面的使用,最终把它变成基础设施的一部分,为使用数据库的人提供通用的服务,甚至他不需要知道算法到底在干什么,只要用标准的数据库服务,用这个算法,把数据喂给机器,机器吐出计算结果,就这么简单。就像机械一样,你需要知道某个泵是怎么造的吗?不需要。只须拿它当抽水机或吸尘器,如此而已。

内容加载中