新浪科技讯 12月21日下午消息,科大讯飞今日举行2015年度发布会,发布了基于语音交互技术基础上的交互界面——AIUI,以及面向C端用户的录音宝、录音笔、讯飞听见网、智学网和E听说等产品。这也意味着,以语言识别和理解为核心人工智能技术,将开始全力发力C端市场。
此前,在今年第三季度,科大讯飞方面推出了能听音乐和操控家居的WIFI叮咚音箱。最近,又推出了能够全程用语音控制,可以给孩子讲故事的陪伴功能的儿童手表。更早之前,科大讯飞推出了讯飞输入法和灵犀语音助手。科大讯飞董事长刘庆峰表示,在万物互联时代,以语音为主、以键盘和触摸为辅的人机交互时代正在到来。
在产品发布环节,刘庆峰首先阐明了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习。科大讯飞此后发布的讯飞超脑2.0科研项目,正是围绕这三方面持续展开,不但赋予机器“能听会说”的能力,还能赋予机器“能理解会思考”的能力,使机器也可以同人一样参加高考。此外,这种技术也将开放给广大的开发者使用。
在讯飞超脑的产业化应用产品层面,刘庆峰首先发布了人机交互新产品AIUI——并声称这对科大讯飞具有里程碑意义。
科大讯飞方面认为,在实际上已经到来的“万物互联”时代,客观上对人机交互提出了更高的要求。但是,一方面目前大多数设备没有屏幕并且与用户之间有一定的距离,另一方面随时随地的多方交互的需求越发明显。
于是,科大讯飞在此次大会上定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括三方面:远场识别、全双工、多轮交互。而AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务等。
值得一提的是,科大讯飞此次还将AIUI应用到了发布会中,在现场,刘庆峰的演讲被实时同步转写成文字在大屏幕显示,接受现场数千参会者和数千万观看视频直播观众的检验。
智学网:机器批改中英双语作文
在讯飞超脑的应用层上,科大讯飞面向教育市场推出了智学网与E听说。
目前,已有全国31个省市的8000万师生在使用科大讯飞面向K12教育所推出的高科技教学与考评产品,希望解决“老师忙、学生盲、资源茫”的教育行业痛点。
具体产品方面,不仅实现了语音与文字的识别、合成与分类,还实现了智能批改、全科阅卷、资源库自动建设等真正具备“人工智能”的产品目标,在教育资源的高效和个性化辅导方面做了试水。
刘庆峰表示,智学网与E听说是之前推出的讯飞超脑的应用产品,未来还将有更多人工智能技术在C端教育市场发力。
录音宝:可能会让速记失业
此外,科大讯飞还在大会上发布了会议和视频需求导向的To C产品——录音宝、录音笔与讯飞听见网。
据刘庆峰介绍,音文转写是当下都市生活的一种经常性需求,在正式发布之前,录音宝产品已经有了超过100万的用户。而随着流媒体的不断演进与普及,相信,在未来的图文直播时代,科大讯飞的音文转录产品的价值将会更加凸显。
在现场,科大讯飞还邀请了10家知名速记公司的工作人员,进行同台PK,但是就整体音文转换上,确实在现场效果方面,录音宝效果惊人——这可能会在未来淘汰很大一部分速记从业人员。
在刚结束的第二届世界互联网大会上,将人工智能技术应用到无人车领域的公司董事长李彦宏说:“在未来,人工智能将取代相当一部分简单脑力劳动。”
然而,从科大讯飞发布的产品来看,人工智能带来的产业革命还远不止“简单脑力劳动”,在现场,刘庆峰还演示了利用产品语音订票、改签、开空调、关加湿器、批改作文等等,俨然一个生活的智能助手,并在没有屏幕的情况下,通过语音去实现交互——一定程度上,智能手机也可能成为被人工智能颠覆的产业。
在担心越来越聪明的机器和人之间的关系时,科大讯飞研究院院长胡郁表示:“我们担心机器越来越聪明了会不会威胁到人类、伤害到人类?但和人一样,当学习的越多,会变得越理性,情绪也会得到最大程度的控制。”(李根)