王珍
他一边演讲,机器人一边把他的语音转变为大屏幕上的文字,准确率比速记员还高。回忆起去年年底发生的这一幕,获得“2015第一财经。·中国最佳商业领袖奖年度创新典范”的科大讯飞股份有限公司董事长刘庆峰十分自豪,因为中国企业定义了万物互联时代人机语音交互的全新标准。
刘庆峰在接受第一财经记者专访时乐观预期,人工智能未来5~10年内将在各行各业推广应用。
中国在人工智能领域从后来者到掌握话语权的整个过程,刘庆峰是亲历者和推动者。科大讯飞创立于1999年,在刘庆峰的带领下,一直坚持自主创新,走产学研结合的道路,现已成为智能语音领域亚洲最大的上市公司。如何在科技创新与商业应用之间取得平衡、形成良性循环?刘庆峰的心得是,让人工智能的成果“沿途下蛋”。
艰苦创业:远见 坚持
今年距离世界上人工智能概念的首次提出,刚好60年。而中国人工智能的发展历史只有30年——1986年国家863计划中首次提出做语音合成。
1990年,刘庆峰入读位于合肥的中国科学技术大学,1992年便进入由王立华教授牵头设立的人机语音通讯实验室,从此与智能语音结下了不解之缘。1999年,刘庆峰与科大的师兄弟们一起创办了科大讯飞,探索产学研结合的机制来发展智能语音产业。
智能语音是一门交叉学科,需要声音、语言和计算机多学科的融合。在新的机制下,科大讯飞承担了智能语音国家工程实验室的职能,加快整合国内外的源头技术资源,在清华大学、中国科学院声学所和中国社科院语言所等单位,都建立了联合实验室。
一开始,刘庆峰是实验室的主任,相当于总工程师。后来,大家发现如果把握不住前瞻性的技术方向,市场先机就保不住,因此都推刘庆峰当CEO。事实证明,刘庆峰当了CEO后,按照新的产业规划和路径,聚集更多人才到科大讯飞的旗下,研发速度更快了。
完成第一阶段融资,科大讯飞初步打开局面后,市场突破却比想象难得多。“我们折腾了很久。”刘庆峰回忆说,科大讯飞最早做了一款个人产品——只要会说话就会用的电脑。
不过,那时的刘庆峰却不知道怎么做市场宣传,售后服务的复杂性也超乎预期,当时盗版又非常严重。1999年底、2000年初,科大讯飞选择了另一条路——给银行和电信提供语言核心能力,别人不敢给这家刚起步的小公司大订单,科大讯飞就跟华为等开发伙伴合作。
直到2000年底,科大讯飞的第一代语音平台才基本成型,后来得到联想、的入股。“不经过两三年艰苦的努力,尤其是做技术创新突破,是很难实现盈亏平衡的。”刘庆峰说,当时随时面临创业团队解散的风险,过程非常痛苦。
之所以坚持下来,刘庆峰坦言,核心是对语音发自内心的热爱。
“第一,我们热爱它。第二,我们对自己有信心。第三,商业逻辑也决定了必须要做源头创新,才有可能在市场上立足。高科技领域从来没有捷径可走,你如果不做原创技术创新,那市场上一定没有你的机会,很多技术产品只有第一、没有第二。”刘庆峰说。
人工智能:科研 应用
2016年元旦,在一次公开演讲中,刘庆峰预言“今年将是人工智能的元年”。
刘庆峰向第一财经记者表示,自然语音合成,可以理解为机器有了人的嘴巴、耳朵和大脑。发展到今天,要从感知智能到认知智能。“未来机器学习人类的认知计算,应该是从语音和语言为入口。为什么呢?因为它可以通过万物互联,从各方面来收集人类的需求,来理解人类的思考,然后又通过语音和语言把它的服务能力重新运用于人类,所以,以语音和语言为入口的认知计算是未来人工智能发展的必然路径。”
目前,科大讯飞的语音云平台,每天已经有10亿人次使用。
去年12月21日,刘庆峰在科大讯飞首次面向全球的三千多人年度发布会上发表演讲时,让机器自动把语音转换成文字,在两边大屏幕同步给大家看,通过视频直播让所有观众都可以看到机器“转写”的结果。一个多小时的演讲,机器“转写”的准确率超过95%,比速记员还高。
“我们定义了万物互联时代人机语音交互的全新标准。”刘庆峰自豪地说,万物互联时代的人机交互,第一需要远场,人对机器说话,应该在3~5米之外也能听得清;第二可以随时随地打断了仍能继续进行交互;第三是上下文要相关,比如问上海明天天气,机器回答完,你说合肥呢,它马上就知道说合肥的天气。
“我们提出叫AIUI,就是人工智能时代的用户界面,会面向全行业来提供服务。”刘庆峰认为,人工智能未来在越来越多的领域代替人的工作,有一种说法是,到2018年,300万人的工作将被机器替换。“技术创新将来不会颠覆人类,而是会让人类生活得更幸福。”
刘庆峰举例说,“现在机器对情感的计算和模仿能力越来越强”。科大讯飞的部分技术已开始在商业领域应用,比如,中国移动的客户服务系统,通过接线员和顾客的对话,可以分析出有没有异常的情绪,是悲观还是不耐烦等,还可以模仿郭德纲、林志玲的声音来回答,“这样人类将来就可以从简单或复杂的劳动中解放出来,有更多时间探索更广阔的未来”。
科大讯飞有一个“超脑”计划。作为计划的一部分,科大讯飞正在做类人答题机器人,让机器未来三到五年,到2020年可以考上一本。它有交互、知识管理、学习和推理三方面能力,可应用在教育、医疗等领域。
目前,广东省高考的英语口语考试,已经由科大讯飞的机器在打分了。在安徽省的合肥市和安庆市,初中毕业考试的语文作文、英语作文,科大讯飞的机器已经参与改卷了。通过应用这套系统,还可以提升日常师生教课和学习的效率。
而在医疗领域,刘庆峰说,一线的全科医生将来很缺,这套系统也可以应用在医疗上。未来医生看病,可能会越来越多在网上进行,病人一说病症,系统就自动做出判断,给医生相应的提示和指导。
“讯飞超脑计划的思路叫沿途下蛋,阶段性成果要能用起来。”刘庆峰透露,讯飞已推出一个智慧学习的网站叫“智学网”,已经有几千家学校的老师和学生开始用。
“沿途下蛋”的过程中,如何在技术创新与商业收益之间平衡?刘庆峰介绍了其中的秘诀:科大讯飞有四级体系,联合实验室面对5~10年甚至更长远的研究;科大讯飞研究院做3~5年的研发;语音云平台的开发部门把研究院的成果变成产品,外部的创业者也可以方便调用;在云平台上,有教育业务、客服业务等各种服务。“这四级体系就可以保证我们不断地进行源头技术创新,同时还不断地把阶段性成果输入到市场上。”