游客

智能音箱大战:中国会否诞生亚马逊Echo?

游客 2017-07-11 07:29:37    201267 次浏览

7月5日,推出了自己的首款消费级AI产品天猫精灵X1,同日也宣布了DuerOS开放平台,可以支持基于语音和图像识别的智能产品开发。

细数当前的智能音箱领域的玩家,既汇集了、、、、三星等国际巨头,阿里、、小米、联想等国内企业也纷纷入局。

Strategy Analytics今年6月下旬发布的研究报告显示,全球基于Wi-Fi的无线音箱出货量在2016年增长62%达到1400万台,其中,亚马逊在增量中占有77%的份额。

一位不愿具名的行业人士向21世纪经济报道记者分析认为,亚马逊Echo以语音为入口接入家庭智能,整个处理在云端进行,背后是软件、硬件以及开发者的完整生态。由于一些国外的云服务和内容在国内不能使用,未来中国肯定会有像亚马逊一样做平台生态的公司出现,开放硬件接口给厂商,这也给本土企业带来新机遇。

语音交互落地

“从90年代末推出了第一款商品化的语音识别系统ViaVoice,到比尔·盖茨倡导下一代语音交互界面,做了十几年还没有成功案例。Echo真正教育了用户和市场,给行业树立很好的标杆。”在7月7日-7月9日举办的CCF-GAIR全球人工智能与机器人峰会上,元趣信息技术CEO吴义坚说。

亚马逊于2014年发布的智能音箱Echo能够依靠语音助手Alexa实现音乐播放、新闻搜索、网购下单、Uber叫车、外卖预定等服务,被认为打开了物联网的一个重要入口,以此成为行业标杆。据不完全统计,截至目前,Echo在全球已经卖出超过一千万台。

“Echo的成功,让更多人相信未来物联网的入口应该是智能语音识别器,这是Synaptics把语音纳入人机界面的一个重要原因。”人机界面交互解决方案设计制造公司Synaptics于6月宣布收购了语音音频处理方案商Conexant(科胜讯系统),其副总裁兼中国区总经理卢兵此前向21世纪经济报道记者介绍,“我们一致认为,语音已经到了一个时间点,会成为下一代人机界面的主要功能。”

目前来看,近场语音的识别率已经达到了相当高的程度,科大讯飞、搜狗等语音输入可以达到95%以上的准确率,但实际的使用场景中还有很多障碍需要跨越。“从远距离、噪音环境的处理,口音、方言的支持,智能化场景对联动、控制、兼容性的要求等方面存在各种各样的问题。我们觉得大规模商用过程中,目前我们的技术和产品还没有那么成熟。”门罗机器人创始人杨兴义认为,语音语义在用户体验的角度还处在比较早期的阶段。

超多维创始人兼董事长戈张日前向21世纪经济报道记者分析认为,未来的产品发展在外观、硬件、服务、设计上会越来越综合化,产品并不只是一款硬件,还包含软件平台、算法、内容等,是个系统工程。Echo的优势一方面在于它的控制能力,另一方面是它的服务能力。要做成一款成功的智能语音产品,并商业落地,不是一件容易的事。

 中国会否出现Echo?

从早期的京东叮咚音箱到近期的喜马拉雅小雅AI音箱、阿里天猫精灵,中国市场已经有着众多搭载智能语音技术的硬件产品,但遗憾的是,并没有一款像亚马逊Echo这样深入大众后流行起来。

从事语义理解的蓦然认知CEO戴帅湘表示并不看好音箱品类。“要成为一个爆款,需要有存量市场,产品有延续性。推一个新品类需要强大的说服用户的能力,这是有难度的。”

他解释称,中美客厅文化存在差异,音箱在国内家庭并没有足够的使用习惯,市场没那么大。但他也认为入局者众至少可以教育民众,对整个交互产业链都是好事。蓦然认知目前主要打造的交互场景是家居和车载,这被戴帅湘认为“前景广阔”。

在吴义坚看来,中国已经具备诞生Echo的土壤,其中阿里是有可能做成Echo生态的——在人工智能语音上,阿里最近几年从全球范围内笼络到很多资深人才加入,有很强的技术积累;它也有大量音乐、内容、电商等方面的服务,具备商业化的条件。

据悉,一个语音产品方案由三部分组成,硬件前端包括麦克风阵列、降噪算法、芯片、硬件平台等,云端包括语音识别和语义理解、语音数据,内容合作有音乐、天气、短信、通话等应用工具。如果未来消费电子都支持语音交互,这也将带来从元器件到内容服务全产业链的重构。

从国内的产业链上看,声智科技CEO陈孝良指出,首先麦克风要在性能、低功耗上做很大的改进,“整个全球市场上中国的麦克风产业占的比重很小,核心技术不在国内。而且我们现在做的麦克风是标量麦克风,只能取一个物理量,下一步要解决很复杂的声学问题,需要矢量麦克风。我们国内相对会落后一点。”此外,芯片、算法上的原创性技术,以及商业化方面也都面临挑战。“国内的内容和服务相对比较割裂,但亚马逊就把很多优势集中在一起。”

他同时指出,远场语音交互开始是智能音响,但是将来绝对不仅仅是智能音响,技术还会扩展到很多其他的产品。

内容加载中