游客

巨头对垒平台:下代人机交互底层智能语音操作系统

游客 2017-07-10 05:08:49    201624 次浏览

AI是风口,终须落地。一款让大众可用的AI产品,哪里是最好切入口?上周,AI开发者大会气势汹汹,但焦点被无人驾驶吸睛,就在同一天,也拿出首款消费级AI产品天猫精灵,背后AliGenie的露面,让人豁然领会百度也在推介同级别的DuerOS——从智能手机为载体的触屏,到智能硬件万物互联的语音,下一代人机交互底层智能语音操作系统,才是巨头直接对垒的舞台。

  技术必然

移动互联网在便捷民众生活,却又在制造麻烦。年轻人每天离开家之前,都要嘱咐年长的妈妈,电视这么多的按纽别按错了,因为智能电视通常按错了一个按键,一天都可能看不了电视。

智能手机因为触屏而变得操作简单,但在电视、空调、洗衣机……更多的硬件家居,仍然是按钮为王,一旦加上智能联网属性,操作反而更加复杂。即便是智能手机,对未曾接受系统互联网教育的“50后”、“60后”老年人,依旧是个复杂的事情。

阿里巴巴人工智能实验室负责人浅雪坦言,“虽然今天手机这么普及,但是我的父母用手机的时候主要用手机的交流功能,而手机之外,80%的App老年人不会使用。这说明我们的交互方式可能还不是最好的,触屏发展到今天,一定还有更好的替代方法”。

在百度度秘事业部总经理景鲲看来,这样的需求不仅存留在老年人心中,也存留在每一个人心中。每个人都曾幻想过着动口不动手的生活,每天回家对电视说,电视打开调到上次看的节目,睡觉前想放松一下,想和床头的智能音响说,能不能播放舒缓的音乐。冬天很冷,想对电灯说,电灯关灯。

人和设备自由沟通是科技进步的重要标志,在多数产业人士看来,如同Windows图形界面取代DOS命令系统,触屏交互取代鼠标键盘输入。巨头瞄准了下一代人机交互方式就是语音交互。在国外,、、苹果、都已经投入巨大的人力来推动这个时代的变革,来自eMarketer的数据显示,在今年一季度美国语音助手市场中,Amazon Echo的市场份额达到70.6%,Google Home则占到23.8%,而其他厂商(包括苹果、联想、LG等)分食剩下的市场份额,为5.6%。自2014年发售以来,亚马逊Echo音箱及另外两种语音产品累计销售量接近1000万-1100万台,销售额达到8亿-10亿美元。市场研究机构Strategy Analytics预计,到2022年,北美1/3的家庭会配备智能音箱。

在中国,2015年联合科大讯飞研发推出叮咚音箱,小米2016年联合科大讯飞推出小米音箱。而现在阿里巴巴的天猫精灵X1来了,背后则是智能语音操作系统AliGenie对垒百度DuerOS的更大野心。

  巨头对垒

天猫精灵X1,面向家庭用户,定价只有499元。在多数业内人看来,一台硬件设备并不是最终目的,阿里的想法在于支撑天猫精灵的中文人机交流系统AliGenie。

阿里巴巴人工智能实验室介绍,AliGenie目前涵盖包括音乐音频、家居控制、购物充值、儿童教育、技能市场的功能。可以或正在拓展的行业解决方案包括儿童领域、酒店领域、家庭场景下、toB其他商业场景、线下零售场景与其他显示设备结合的场景。

这看起来与App或者操作系统所谓的开放平台并无太大区别,苹果iOS和安卓皆成名于此,微信甚至也想用小程序,打造轻模式的开放生态。区别的重点依旧是语音,这是阿里能够掌握的“核心科技”。按照浅雪的构想,依靠阿里云的机器学习技术和计算能力,AliGenie能够不断进化成长,越用越聪明,成为人类贴心的智能助手。

浅雪说,语言是人与人之间最主要的沟通方式,也应该是人与另外一种智能进行交流的主要方式。云端一体化带来的趋势是高度智能化,智能终端需要一个比手机触屏更强大的人机交互方式。

竞争门槛在细节处,阿里表示,针对声音环境的多变性,X1还具备一定的自我学习功能,可以根据环境噪音进行优化,适应不同家庭环境噪音。经过一周左右的使用,X1会更加适应所在环境,语音识别准确率达到业界最高水平。

据悉,考虑到中文语义环境的复杂性,阿里人工智能实验室通过众包平台等方式,针对生活中的各种生活场景所需要用到的语义问法进行了征集,仅天气预报就能够理解786种中文问法,通过深度机器学习,天猫精灵X1已覆盖20个领域的中文自然语义理解,能够理解人类80%的意图。

百度DuerOS不遑多让。让一个只会说英文的音箱学会说中国话需要多久?答案是1分钟。在百度AI开发者大会上,百度工程师仅用17行代码,1分钟时间,就让搭载了Alexa系统的Anker音箱,从只会讲英文变成听得懂且说得好中国话。

景鲲认为,唤醒万物最核心的三要素是听清、听懂、满足。百度的语音识别率达到97%以上,百度的Deep Speech是2016年MIT十大突破性技术之一。

“只做好这些还不够,人工智能时代要与场景结合,放在家庭条件、家庭小房间,放在车上,把技术真正放在场景里解决问题。所以我们研发了远场相关的语音技术包括麦克风阵列、回声消除、波束成形、语音唤醒、远场识别。”景鲲说。

  合纵连横

是操作系统,就不是一个人在战斗。阿里人工智能实验室借着发布天猫精灵公布了首个硬件开放合作伙伴——将与国际玩具巨头美泰合作探索其旗下主要核心IP如费雪、芭比、托马斯和朋友等智能玩具的合作开发机会。

北京商报记者了解到,目前AliGenie支持100多个品牌,包括接入阿里智能联盟、涂鸦科技、broadlink等智能家居方案的产品,更多智能家电也正在接入中。

百度DuerOS则与中信国安广视、联想、美的、海尔、HTC、小鱼在家等合作伙伴展开广泛合作。景鲲称,依托三款DuerOS开发套件和一款硬件参考设计,“只要接一个电源,接一个麦克风,就可以让你身边的家电设备‘说话’了。”

而面对巨头递出的橄榄枝,中小企业做出了两手准备。喜马拉雅是百度DuerOS的合作伙伴,该公司副总裁、硬件事业部总经理李海波认为,喜马拉雅拥有非常优质的互联网音频内容资源,极大地丰富了DuerOS的内容体系。同时,音频内容与智能语音技术有着天然的相似点,双方都希望通过声音的形式与人进行互动。

就在不久前,喜马拉雅不久前刚刚联合猎户天空(投资的语音人工智能公司)推出了智能音箱小雅。

TCL多媒体科技控股有限公司也是DuerOS的合作伙伴,该公司副总裁李昕认为,DuerOS在人工智能领域的优势与TCL在电视领域的积累相结合,一定会打造出与众不同的电视产品,联合DuerOS一起共建TV生态。

7月3日,TCL公告称,旗下互联网品牌雷鸟与签订股权合作合同,腾讯4.5亿元投资互联网电视雷鸟,获得16.67%的股权,成为雷鸟第二大股东。

分析人士指出,互联网企业和硬件企业的关系已经不能单纯用“站队”来描述,作为产业链的上下游,互联网企业逐渐成为底层平台方,提供多种接口,而硬件企业依赖制造和供应链优势,可以在多个平台做出选择,甚至可以不同型号不同选择。

内容加载中