游客

吴晓如:科大讯飞让机器有了情感和嘴巴 | 产品家12

游客 2017-01-06 10:06:09    200940 次浏览

《产品家》旨在通过对科技领域领先人物的采访,分享产品家的产品理念,探索成功产品背后的故事。本期《产品家》对话科大讯飞高级副总裁吴晓如,听他讲述,科大讯飞如何让机器人能听会说,能理解会思考。

吴晓如:科大讯飞让机器有了情感和嘴巴 | 产品家12

科大讯飞高级副总裁吴晓如

“我们的梦想,不止是让机器人能听会说”

科大讯飞成立于1999年12月30日,是从中科大大学实验室走出来的企业。经过十几年的发展,科大讯飞目前已成为中国最大的智能语音技术提供商,在智能语音技术领域拥有长期的研究积累,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。

吴晓如介绍说,科大讯飞是一个技术驱动的企业,他们坚持的梦想是让机器人像人一样,能听会说,能理解,会思考。而科大讯飞17年来在语音技术方面的持续创新,就是一步步实现这个梦想的过程,通过人工智能的不断发展,让机器说的更自然,让机器听的更准确,

“人工智能好像这几年突然热起来了,但是对于讯飞来讲,我们1999年创业开始一直干的就是这个活。”吴晓如说。

人工智能通常被分成三个阶段,第一个阶段是计算机阶段,让计算机具有较高的运算速度,目前这一阶段基本已经实现。科大讯飞主要解决的是后两个阶段,即感知智能和认知智能。

在感知智能阶段,主要解决的是听和看的问题,即让机器代替人的眼睛、耳朵,可以将听到的声音转换成文字等。例如科大讯飞提供的讯飞输入法、作文的自动阅卷功能等等

在认知智能阶段,不仅要让机器听得清,更要能听得懂,例如,除了将听到的语音转化成中文文字之外,还可以通过机器翻译将其翻译成对应的英文语句。

吴晓如介绍说,语音技术作为人工智能技术中间一个比较重要的领域,是科大讯飞17年来一直坚持的方向,同时也在探索如何将技术落地到真正的应用当中去,做成能解决用户痛点的好产品。因此,为了能实现机器能听会说,能理解会思考,科大讯飞聚焦技术的创新,不断发展语音合成技术、语音识别技术、图像识别技术,并将其应用到医疗、教育、汽车等领域。

语音识别让机器有了嘴巴

语音识别让机器有了一个“嘴巴”,可以实时将各种文字读出来,例如老人可以通过语音播报听书或者报纸,我们开车的时候可以通过语音来听一些文字性的内容。同时,现在的语音合成还走向了个性化的合成。比如通过语音合成模拟奥巴马的音色,可以模仿奥巴马发出声音。或者通过模仿一个人的音色,让一个不会说法语的人的声音“说法语”。

在医疗领域,语音识别也具有实用性,例如科大讯飞推出了一款APP,在医生查房时,可以通过语音输入来记录病例和布置医嘱,节省了医生手写病例的时间,省去了护士的等待时间,提高了医生寻房的工作效率。

除此之外,医生可以通过语音随时查询这个病人当前和过去的一些情况,还可以搜索到相关的治疗方案和医学资料作为参考。

而借助图像技术,可以帮助放射科医生进行诊断结果,吴晓如介绍说,在肺部肿瘤和肺部结节在图像诊断上的结果,机器已经和医生不相上下了。

“人工智能是非常勤奋的学习者,只要以前有一定量的,医生看片子的结果,他用这个结果去学习,学完了他就可以看其他的片子。所以就是可以看到,不仅帮他做笔写的记录,不仅帮他查询后台的资料,还可以大量的图像诊断的结果,机器帮他自动看。自动看就带来了两种,一种是提高医生的效率,还有一种是帮助医生诊断的结果更加准确,所以可以看到,整个人工智能目前已经可以给医生带来更大的方便了。”

让机器成为有感情的设备

科大讯飞基于语音识别技术推出了一个应用——飞鱼系统。用户可以通过语音操作飞鱼系统拨打电话、搜索音乐、查询天气情况、搜索目的地等,它承担了一个车载秘书的功能,当你使用的越多,它对用户的个人喜好越来越了解,对答的时候便能提供更准确的服务。

“相当于汽车原来是一个冷冰冰的交通工具,因为飞鱼系统,或者智能交互语音,技术应用,它变成了一定意义上有情感的交通设备”

除了汽车领域,科大讯飞在智能家居领域也有发展,通过和京东合作推出智能家居产品,其中智能音箱“叮咚叮咚”是一款非常有意思的产品。

“你在3—5米范围内想听任何歌你就跟他说就可以了,你跟他说叮咚叮咚,我想听什么歌,他就会从后台海量的音乐库里面,把这个音乐给你播出来。当然以后,这个叮咚叮咚以后还会做很多扩展,它可以成为你家里面以后智能家居的中央控制设备,比如他可以控制窗帘,冰箱彩电打开都可以。所以叮咚叮咚以后可以成为你家里面控制各种智能家居的重要环节。”

人工智能,让教育可以因材施教

除了医学这种专业化的技术应用领域,人工智能在教育领域也得到了应用。

在因材施教方面,科大讯飞通过知识图谱技术,可以收集和分析学生日常学习和完成作业过程中产生的数据,精确的告诉老师每个学生的知识点掌握情况,老师便可以针对每一位学生的学习情况来有针对性的布置作业,达到因材施教的效果。

在语言教学方面,科大讯飞推出一款叫教具的产品,将触控笔放在书中的文字上,它就可以将文字读出来,可以辅助偏远地区或者少数民族区域的普通话教学,也可以应用到英语等外语教学过程中。

而在教学方式方面,智慧课堂可以为老师提供更为丰富的教学手段,老师在上课的时候不仅仅是具备一本教科书,而是可以任意调取后台海量的学习资源,例如当老师讲到淝水之战时,可以通过地图演示、播放视频等形式来帮助学生理解。

“讯飞要做一个非常酷的公司”

吴晓如说,现在外界讲到科大讯飞的时候,会说这是一个技术很牛的公司,但是科大讯飞要“顶天立地”,在技术上保持领先之外,也为大家的生活和行业带来了非常多酷炫的产品,改变很多人的工作模式和生活模式,例如记者采访的时候可以通过讯飞的产品将采访录音直接转化成文字,法官庭审的时候有了一个机器秘书帮他做庭审记录等等。

但由于大部分是B2B的业务,大众消费者对于科大讯飞的认知度并没有那么高,以后科大讯飞会通过产品,让外界了解到:这是一家很酷的公司。

“我们也不仅仅是讯飞仅仅具有理工范,我们还希望它更具备一些人文方面的情怀,希望两方面结合起来,给外界的产品感觉我们这个产品不仅仅酷在技术上,而且还酷在实际应用上。”

内容加载中