智能音箱大戰：中國會否誕生亞馬遜Echo？

7月5日，推出了自己的首款消费级AI产品天猫精灵X1，同日也宣布了DuerOS开放平台，可以支持基于语音和图像识别的智能产品开发。

细数当前的智能音箱领域的玩家，既汇集了、、、、三星等国际巨头，阿里、、小米、联想等国内企业也纷纷入局。

Strategy Analytics今年6月下旬发布的研究报告显示，全球基于Wi-Fi的无线音箱出货量在2016年增长62%达到1400万台，其中，亚马逊在增量中占有77%的份额。

一位不愿具名的行业人士向21世纪经济报道记者分析认为，亚马逊Echo以语音为入口接入家庭智能，整个处理在云端进行，背后是软件、硬件以及开发者的完整生态。由于一些国外的云服务和内容在国内不能使用，未来中国肯定会有像亚马逊一样做平台生态的公司出现，开放硬件接口给厂商，这也给本土企业带来新机遇。

语音交互落地

“从90年代末推出了第一款商品化的语音识别系统ViaVoice，到比尔·盖茨倡导下一代语音交互界面，做了十几年还没有成功案例。Echo真正教育了用户和市场，给行业树立很好的标杆。”在7月7日-7月9日举办的CCF-GAIR全球人工智能与机器人峰会上，元趣信息技术CEO吴义坚说。

亚马逊于2014年发布的智能音箱Echo能够依靠语音助手Alexa实现音乐播放、新闻搜索、网购下单、Uber叫车、外卖预定等服务，被认为打开了物联网的一个重要入口，以此成为行业标杆。据不完全统计，截至目前，Echo在全球已经卖出超过一千万台。

“Echo的成功，让更多人相信未来物联网的入口应该是智能语音识别器，这是Synaptics把语音纳入人机界面的一个重要原因。”人机界面交互解决方案设计制造公司Synaptics于6月宣布收购了语音音频处理方案商Conexant（科胜讯系统），其副总裁兼中国区总经理卢兵此前向21世纪经济报道记者介绍，“我们一致认为，语音已经到了一个时间点，会成为下一代人机界面的主要功能。”

目前来看，近场语音的识别率已经达到了相当高的程度，科大讯飞、搜狗等语音输入可以达到95%以上的准确率，但实际的使用场景中还有很多障碍需要跨越。“从远距离、噪音环境的处理，口音、方言的支持，智能化场景对联动、控制、兼容性的要求等方面存在各种各样的问题。我们觉得大规模商用过程中，目前我们的技术和产品还没有那么成熟。”门罗机器人创始人杨兴义认为，语音语义在用户体验的角度还处在比较早期的阶段。

超多维创始人兼董事长戈张日前向21世纪经济报道记者分析认为，未来的产品发展在外观、硬件、服务、设计上会越来越综合化，产品并不只是一款硬件，还包含软件平台、算法、内容等，是个系统工程。Echo的优势一方面在于它的控制能力，另一方面是它的服务能力。要做成一款成功的智能语音产品，并商业落地，不是一件容易的事。

　中国会否出现Echo？

从早期的京东叮咚音箱到近期的喜马拉雅小雅AI音箱、阿里天猫精灵，中国市场已经有着众多搭载智能语音技术的硬件产品，但遗憾的是，并没有一款像亚马逊Echo这样深入大众后流行起来。

从事语义理解的蓦然认知CEO戴帅湘表示并不看好音箱品类。“要成为一个爆款，需要有存量市场，产品有延续性。推一个新品类需要强大的说服用户的能力，这是有难度的。”

他解释称，中美客厅文化存在差异，音箱在国内家庭并没有足够的使用习惯，市场没那么大。但他也认为入局者众至少可以教育民众，对整个交互产业链都是好事。蓦然认知目前主要打造的交互场景是家居和车载，这被戴帅湘认为“前景广阔”。

在吴义坚看来，中国已经具备诞生Echo的土壤，其中阿里是有可能做成Echo生态的——在人工智能语音上，阿里最近几年从全球范围内笼络到很多资深人才加入，有很强的技术积累；它也有大量音乐、内容、电商等方面的服务，具备商业化的条件。

据悉，一个语音产品方案由三部分组成，硬件前端包括麦克风阵列、降噪算法、芯片、硬件平台等，云端包括语音识别和语义理解、语音数据，内容合作有音乐、天气、短信、通话等应用工具。如果未来消费电子都支持语音交互，这也将带来从元器件到内容服务全产业链的重构。

从国内的产业链上看，声智科技CEO陈孝良指出，首先麦克风要在性能、低功耗上做很大的改进，“整个全球市场上中国的麦克风产业占的比重很小，核心技术不在国内。而且我们现在做的麦克风是标量麦克风，只能取一个物理量，下一步要解决很复杂的声学问题，需要矢量麦克风。我们国内相对会落后一点。”此外，芯片、算法上的原创性技术，以及商业化方面也都面临挑战。“国内的内容和服务相对比较割裂，但亚马逊就把很多优势集中在一起。”

他同时指出，远场语音交互开始是智能音响，但是将来绝对不仅仅是智能音响，技术还会扩展到很多其他的产品。

智能音箱大战：中国会否诞生亚马逊Echo？

相关推荐