新浪科技讯 7月11日上午消息,2017中国互联网大会在北京国家会议中心拉开帷幕,为期三天。大中华地区CTO、中国研究院院长沈晓卫围绕“大数据背景下的人工智能”主题进行了观点分享。
沈晓伟沈晓卫认为在人工智能时代的创新战略需要从四个方面进行布局:1)人工智能核心技术的创新,包括机器学习算法、语音识别、图像识别及基于构建这些核心算法的能力。当下的深度学习算法仍然需要很多人工干预,未来如何减少人工干预,构建数据自我驱动的学习算法成为关键。
2)人工智能技术与行业结合,即利用人工智能技术来解决行业中的问题,这其中包括环境中的问题、教育中的问题、医疗中的问题等;3)区块链技术,区块链作为分享式的共享账本技术,它能够极大地降低交易成本,提高商业交易的安全性;4)构建新一代的计算能力,包括芯片技术、服务器的技术等,以及在摩尔定律后时代中的纳米技术、量子计算技术等。
结合IBM自身,沈晓卫认为人工智能(认知)、云、行业是IBM转型的最重要三个词汇,即构建基于行业的从云端提供的具有人工智能能力的或者具有认知能力的行业解决方案,“这是我们认为IT行业接下来发展一个非常非常重要的方向”。他分别列举了IBM三个具有代表性的行业应用解决方案,包括利用人工智能技术与物联网技术结合进行环境污染源监控、基于临床数据的机器学习建立肿瘤诊断系统、利用视频自动解读与图像识别技术进行自动化质量检测。
以下为IBM大中华地区CTO、中国研究院院长沈晓卫的演讲全文:
沈晓卫:大家上午好!很高兴今天能够有机会来参加2017年的中国互联网大会,我也希望能够利用这个机会跟大家分享我们在人工智能时代、大数据时代关于创新战略的一些想法。
应该说,我们今天处在一个从数字化迈向智慧化这样一个时代,在这样一个时代,大数据的出现,而传统的IT技术不能够满足我们对数据分析,从中间产生洞察力这样的需求。所以我们看到大数据,包括用于大数据分析的,无论是人工智能的算法,还是运行这些算法的芯片,整个这个时代对这样的一些数据、芯片、算法来重新塑造。在这样一个情况下来看一下人工智能时代的创新应该是一个什么样的战略?从技术的角度来看,我们认为今天有四个大的方向,就是在人工智能时代、大数据时代,我们需要来关注的。
首先是人工智能核心技术的创新。这里面包括机器学习的算法,包括语音的识别、图像的识别及基于这些核心算法之上,我们需要构建的能力。应该说在这上面还是有非常多的事情需要去探讨的,比如今天深度学习的算法,基于数据的自我学习,但是确实是需要很多的人工干预,如何来构建新一代的机器学习的算法,能够减少这种人工干预?第二方面我们要看的就是如何把人工智能的技术与行业结合,如何利用人工智能技术来解决行业中的问题,可能是环境中的问题,可能是教育中的问题,可能是医疗中的问题,等等。第三点我想特别谈到区块链技术,区块链作为分享式的共享账本技术,它能够极大地降低交易成本,提高商业交易的安全性。如何在大数据时代把区块链技术和人工智能技术做一个结合?在合适的行业中做这样的应用。第四点,从技术创新的角度来看,非常重要的就是我们需要来构建新一代的计算能力,因为无论如何,最终的人工智能的算法、最终的大数据的分析都是在新一代的计算平台上实现的,这里面包括芯片技术,包括服务器的技术,等等,甚至也包括今天正在开始看到的后摩尔定律时代,或者摩尔定律后时代,无论是纳米技术还是在之后更进一步看到的量子计算这样的一些新的技术,如何构建新一代的计算系统来支撑未来的人工智能应用。
这里我再多说几句,从技术的角度,从人工智能系统的这样一个角度,我们需要构建的人工智能系统不仅是算法和应用,同时要构建人工智能的平台,需要在这样的平台上把人工智能的能力以服务的形式提供给我们的客户,提供给人工智能应用的开发者。而人工智能系统也是一样的,可能是今天传统的计算机,我们今天已经在使用的计算机的一个延展,无论是用人工智能芯片的加速,还是用今天已经存在的FPGA的加速,或者图形处理器的加速,都是在这方面的努力。
另外一点我特别想提到,我们需要探讨或者来构建基于人脑思维方式或者模拟人脑思维方式,或者某种意义上模拟人脑思维方式的新一代的系统。今天我们可以做到用54亿晶体管模拟100万个神经原,两亿五千万个神经突处。这个距离人脑还是有距离的,但是毕竟是一个好的开创性的尝试。
接下来,我们看在人工智能时代,我们最关键的几点是什么?这里我给出了三个词:人工智能(认知)、云、行业,这也是今天IBM在新时代转型的最重要的三个词汇,就是我们需要构建基于行业的从云端提供的具有人工智能能力的或者具有认知能力的行业解决方案,这是我们认为IT行业接下来发展一个非常非常重要的方向。
在这样的背景下我们来看行业,其实今天的人工智能已经能做很多事情,人工智能可以写诗,可以做电影剪辑,可以做服装设计,等等。当然,人工智能已经在很多博弈类的比赛中战胜了人类。但可能和这些相比,一样重要甚至更重要的是人工智能需要进入到行业中,来解决我们行业中的问题。接下来我就来跟大家分享我们在这方面的一些尝试,因为最终人工智能的成功除了技术的进步,它需要持续不断的商业的成功。
例一:IBM绿色地平线计划,这是2014年开始的一个IBM全球,由IBM中国研究院牵头引领的一个全球的研究计划,这个是做一个什么样的事情呢?就是我们把人工智能的技术、物联网的技术做一个结合,包括云计算的技术,我们来看一看如何来改进空气质量的管理和优化,今天我们可以做到利用人工智能技术来训练大量的,我们把它叫超级模型。利用的数据,这里面有卫星的遥感数据、有气象数据,有一个城市的实时的空寂质量监测数据,当然还有污染源的数据、交通的数据,甚至社交媒体的数据,今天可以做到什么程度呢?我们可以非常精准地预测一个城市未来72小时1公里×1公里PM2.5的浓度。基于此,我们可以对污染源进行溯源,我们也可以对决策提供支持,因为当,比如当污染源达到一定程度的时候,我们可以有不同的解决方案,不同的解决方案有不同的经济成本和社会成本,我们可以为决策者提供支持,来选择更好的方案,这就是人工智能今天在环境中的非常好的应用例子,我们也把绿色地平线计划今天从环境中也推广到能源、食品安全等等这样的新的领域。
我们在认知医疗或者人工智能应用在医疗行业的实践。应该说医疗行业在众多行业中可能是人工智能率先能够取得突破性成果的非常有可能的一个行业,而今天我们也知道,我们能够使用到的用于诊断的医疗数据是真正影响诊断的数据的非常少的一部分,我们今天用到的更多的是临床的数据,大概占到整个数据的可能不到10%或者10%左右,实际上我们知道,还有基因数据,还有更大的所谓的大健康的数据,包括饮食、锻炼、生活规律等等,如何构建新的解决方案为未来的医生诊疗提供更好的决策支持?
例二:今天已经做到的就是我们通过对几十万糖尿病病人,二型糖尿病病人,几十万病人的临床数据学习,把这样的学习自动抽取到信息,与医疗指南的信息做一个结合,来构建针对糖尿病的医疗诊断系统,这样的系统我们已经在实际的社区医院进行试点的试用,今天有超过6000病人已经从这样的系统中获益。这实际上相当于我们为每一个社区医生提供了一个助手,能够为他诊断提供建议。
肿瘤诊断也是一个例子,IBM沃森肿瘤诊断系统,我们在国外一家肿瘤医院,比如以乳腺癌为例,我们今天看到的一些初步的结果,在国外有一家医院,它有15个医生组成了一个诊疗小组,今天针对乳腺癌,沃森给出的建议,在这家医院90%已经与医疗专家所给出的医疗诊断是一致的。医疗影像是另外一个方面,例:我们今天与国内一家合作伙伴合作,他们是做胶囊机器人,我们吞下一个胶囊机器人进行肠胃系统的检查,每次检查能够生成两万到五万张胶片,这里面如果有病灶的话,大概只有几十张、几百张是能够显示出这样的情况,所以我们也需要构建具有人工智能能力的系统,能够帮助医生提高他的工作效率。今天应该说在很多的跟医疗影像有关的领域,有很多种病,今天的技术已经可以做到接近,甚至超过人类医生的精准度。
人工智能跟物联网的结合。刚才谈到的像绿色地平线计划本身就是超大规模的物联网系统,我特别希望在这里强调的就是人工智能技术把智能带到了物理世界,当我们对物理世界进行模拟的时候已经远远超过数据的采集和分析,我们需要构建这种具有自我学习能力的系统,而这种系统不但可以分析结构化数据,它也可以分析非结构化数据,像多媒体数据,它也应该,如果需要的话,也应该用到具有领域知识的物理模型。比如刚才谈到的天气预报模型、污染传播模型等等。在这样一个背景下,我们来看人工智能可能对制造业的影响,它已经超过了我们以前想象的更精准的预测市场的需求,更好的来优化生产的流程。
例三:我们今天可以用对视频的自动解读,图像识别技术,来对一个生产线产品的质量监测进行自动化。比如一个SOP的生产厂商用这样的技术可以做到节省他50%以上的人力,需要这样的人力来用于产品质量监测。
最后特别谈一下,在大数据背景下的人工智能。我们今天讲人工智能有技术的创新、有跟行业的结合,从跟行业结合这一点来讲,与其谈AI是人工智能,我们更多的是把它看作增强智能,今天在大数据背景下的人工智能是需要与行业结合,来增强今天在这些行业中对数据处理的能力,来帮助我们解决行业中的问题,来造福我们的生活,来使我们的社会变得更加地美好。