新浪科技 侯迪憬
在的Echo之后,智能音箱市场的风口在今年被推向高潮。前不久,小米以199元的价格杀入;国外方面,、已经推出相关产品,Facbook放出了烟雾弹,而微软的智能音箱已经在路上,预计今年秋季上市,首发地区在美国。
据微软方面向新浪科技透露,微软的首款智能音箱Harmon Kardon,将采用小娜Cortana作为其语音智能交互系统。7月30日,新浪科技与微软亚洲互联网工程院常务副院长幺宝刚对话,他同时也是微软Bing和Cortana产品团队负责人。
幺宝刚,现任职于微软亚洲工程互联网工程院,主要负责该部门在人工智能、互联网搜索及服务、大数据计算平台、移动搜索及服务等领域的产品及技术开发,其负责的产品及技术兼顾北美、欧洲及亚洲市场。此前,幺宝刚曾在微软美国总部任职,先后任开发经理、开发总监、部门总经理职位。
2014年7月,微软将语音智能助手Cortana汉化,在国内推出中文版小娜。今年是小娜服务在中国落地的第三年,小娜实现了从Windows Phone到iOS平台、Windows10电脑端口的打通。从早期的聚焦在生活服务,向偏向工作和学习场景的应用,如安排日程,工作建议等。从2016年,小娜逐渐推进在第三方服务及各种设备上的落地,如车载音响、家电、云音乐等。
以下为新浪科技与对幺宝刚的对话内容梳理,主要针对Cortana的平台定位,以及微软在语音交互领域的技术落地和生态建设等问题展开。
新浪科技:微软智能音箱为什么选择小娜平台,偏向社交和娱乐的小冰是否更合适?
幺宝刚:小娜与小冰是微软智能助手领域的姐妹花,由不同团队负责。我认为小娜在产品定位上更强调“效率”,两者的差异类似于人类的IQ和EQ,小娜聚焦在前者,让用户的生活和工作更有效率。每个产品都有自身的定位和聚焦点,微软的智能音箱会有这样的考虑,包括音乐、会议助理等功能。当然,小娜也会针对音箱终端进行优化。
新浪科技:在用户语料方面,小娜和小冰的数据是否共享?
幺宝刚:数据在不同层面共享情况不同。在语音识别技术方面,两个平台由统一的语音部门提供技术支持。在Switchboard语音识别任务测试中,微软研究院的自动化系统的错误率(Word Error Rate, 简称 WER)达到5.9%,已经优于绝大多数人类水平;在内容端,我们拥有一部分共同的知识图谱平台;在具体问题应答上,根据场景进行不同优化,小娜和小冰可能会有不同的数据和反馈。
新浪科技:Cortana背后的团队支持情况?
幺宝刚:整体层面来看,微软已经把几个重点的产品团队进行整合,成立人工智能与研究事业部,其中包括微软研究院 (Microsoft Research) 、微软信息平台部门 (Information Platform Group) 、必应 (Bing) 和小娜 (Cortana) 产品部门,以及环境计算 (Ambient Computing) 和机器人团队,由沈向阳博士带领,数千人团队规模。这支队伍间接或直接地给予小娜平台进行支持,具体到小娜 (Cortana)的团队,我们今年也进行了扩充。
新浪科技:Cortana平台的用户规模?
幺宝刚:全球范围内,小娜 (Cortana) 的用户装机量超过1.45亿台,用户问答数据约120亿条,大约每个用户提供10个问题。
新浪科技:微软进入智能音箱市场的时间会不会太晚?
幺宝刚:智能音箱现在还处于形成用户群体的阶段。微软在前三年已经积累了1.45亿规模的用户群体以及问答数据,这是很大的优势;另外,Cortana在产品定位上比较清楚,聚焦在效率的提升上,包括工作和生活场景;其次,这套语音交互系统背后有着Bing搜索平台的支持,Bing在美国用户量排名第二,知识数据积累也很丰富。
新浪科技:Cortana作为智能语音交互系统,后续的开放策略是什么?
幺宝刚:首先,通过团队的努力,Cortana变得越来越智能;通过产品与后台技术结合,计划让Cortana与微软的其他产品进行融合,如Cortana与Microsoft Edge、Skype等;另外,第三个层面是生态平台的搭建,比如进入到网易云音乐、美团产品等;在认知端层面,主要通过微软云Azure平台进行开放,已经开放有27个API;在开发者层面,计划推出面向开发者的技能平台。