虽然苹果先于竞争对手开发了 Siri 语音助手,但却未能保住先发优势,反而被亚马逊和谷歌后来居上。《华尔街日报》日前撰文分析了背后的原因,以下为原文内容。
2014 年末,苹果 Siri 团队的几名成员参加了亚马逊的一场活动。他们原以为自己可以领先于这个竞争对手。
由于能够通过语音指令处理日程安排、文本消息和其他简单任务,这款发布 3 年的苹果产品广受欢迎。一时间,Siri 似乎天下无敌。
然而,当 Siri 团队目睹了亚马逊的一段演示视频后,前景似乎很快发生了变化。视频里是一个能用语音控制的小音箱,可以播放音乐、订购产品、搜索信息。它证明亚马逊已经具备在嘈杂背景中分离人声的能力,而且拥有一款可以远距离响应语音指令的数字助手——而 Siri 当时还不具备这种能力。
“苹果员工的焦虑感陡然上升。”一位当晚出席活动的苹果 Siri 团队前成员说。
丧失先发优势
如今,苹果正在一个它自己开拓的产品领域奋力追赶,使得人们不禁担心这家科技巨头是否已经失去创新优势。
本周一,该公司发布了 HomePod,这款内置 Siri 的家用音箱将于今年 12 月正式开售。该设备可以完成 Siri 的各种功能,包括调节电灯和设置提醒等,但苹果却宣称它主要是一款具备一流音效的高端家庭音响系统。
苹果花了好几年时间才开发出这样一款产品。
该公司当天还宣布将于今年秋天对 Siri 进行升级,可以将英语翻译成 5 种语言,而且能通过对用户偏好的学习,为其提供上网、聊天和应用使用建议。
苹果最多也只能算第三家进军家用音箱市场的科技巨头。亚马逊两年半以前就开始销售 Echo,上月还发布了一款可以通过内置摄像头和显示器进行视频通话的设备,而且同样内置了 Alexa 语音助手。该公司还与很多企业展开了合作,将 Alexa 嵌入福特汽车、LG 冰箱和通用电气的灯具之中。
Alphabet 去年 10 月发布了基于“谷歌助手”的音箱。该公司上月表示,他们将通过一款手机应用向 iPhone 应用提供其语音产品。微软今年 5 月也发布了一款内置其 Cortana 语音助手的音箱,三星电子也有望把该公司的 Bixby 语音助手植入家电产品。
尽管已经可以兼容 Apple Watch 等少数其他设备,但 Siri 很大程度上仍然只是 iPhone 的一项功能。Siri 的功能已经大幅增加,但竞争对手却有后来居上的迹象。多份独立研究表明,Siri 在准确率方面不及 Alexa 或谷歌助手。
成也 iPhone,败也 iPhone
一些前高管、观察人士和客户都表示,由于缺乏紧迫感,加之难以将理念付诸实施,苹果的创新力似乎逐渐丧失。在 CEO 蒂姆-库克(Tim Cook)掌舵的 6 年间,该公司股价大幅飙升,但并未推出足以比肩乔布斯时代的突破性产品——包括 iPod、iPhone 和 iPad。
其中的原因之一或许在于 iPhone 本身。作为有史以来最成功的消费电子产品之一,它为苹果贡献了多数销售额,并且占据了该公司的很多精力。但苹果前高管表示,正因如此,它才限制了该公司的能力,使之难以开发与手机无关的产品——全新的语音控制设备便是其中之一。
“Siri 简直提供了一个教科书般的范本:它最初在技术上领先,而且拥有充裕的资金和人才,但却逐渐丧失领先优势。”科技研究和顾问公司 Constellation Research 首席分析师霍尔格-穆勒(Holger Mueller)说。
苹果的支持者表示,该公司在竞争对手之后进入某个领域,然后占据主导。而苹果则表示,他们的创新速度在不断加快。他们过去 5 年的年度研发开支增至 100 亿美元。该公司还在从事多个潜力巨大的项目,其中就包括无人驾驶系统。苹果指出,Siri 已经借助 iPhone 进入全球数亿用户的口袋——触角之广远超任何一个竞争对手的语音助手。
“从创新角度来看,我们对公司现状很满意。这是我们基因的一部分。”苹果高级副总裁艾迪-库伊(Eddy Cue)在周一的发布会之前接受采访时说,他负责的产品中就包括 Siri。苹果周一还针对开发者推出了增强现实功能,还发布了更加强大的 Mac 电脑。
数字助理已经成为当今科技行业竞争最激烈的领域之一。行业高管表示,这些采用高效人工智能算法的产品所具备的革命意义堪比 PC 和智能手机,未来甚至有可能让电脑与人类展开对话、回忆之前的对话记录,并在没有按钮或触摸屏的情况下提供个性化服务。
乔布斯遗作命运不济
Siri 是乔布斯生前推出的最后一款重要新品。他 2010 年开始看好这项技术,这当时还只是一家小型创业公司针对 iPhone 设计的数字助手应用。Siri 发明人加里-莫金塔勒(Gary Morgenthaler)表示,乔布斯在 45 天内给他们打了 30 通电话,最终说服创始人把公司卖给苹果。乔布斯随后要求他们对部分功能进行微调,以便在不同语言的 iPhone 上流畅使用。
苹果营销主管菲尔-席勒(Phil Schiller)曾在 2011 年将 Siri 称作 iPhone 4s“最好的功能”,它可以将语音转换成文本,还能解读具体的含义,甚至播报天气和安排日程,并在推出后第一年帮助 iPhone 实现 73% 的出货量增长。就在发布第二天,乔布斯便与世长辞。
Siri 团队的前成员表示,自那之后的几年间,由于未能制定野心勃勃的目标,加之战略转移,而且越来越重视用户隐私(此举导致该公司很难实现个性化,也难以改进产品),这个项目的进度便大幅放缓。该项目还遭遇了重要成员的离职,其中一些人甚至跳槽到竞争对手那里。
大约在乔布斯去世后一年,苹果挖来了亚马逊搜索高管比尔-斯塔西尔(Bill Stasior)来负责 Siri。斯塔西尔在麻省理工学院研究人工智能,但他的专长在于搜索,而非语音或语言。这也导致 Siri 团队的部分成员认为,他不再完全认可该产品最初的目标:从 iPhone 向第三方应用渗透。
为了将 Siri 嵌入更多应用——例如,可以让用户查看银行账户余额或订购汽车服务——苹果需要开发一个平台和编码工具,让开发者将这个虚拟助手整合到 iPad、iPhone 或 Apple Watch 应用中。该公司在 2016 年实现了这个目标。
苹果拒绝让斯塔西尔接受采访,他本人也未作出回应。
Siri 联合创始人亚当-切耶(Adam Cheyer)和戴格-吉特劳斯(Dag Kittlaus)也已经因为个人原因离职。他们创办了一家与之竞争的公司 Viv Labs,专门向第三方开发者提供语音系统。此后又有 6 名员工追随他们离职。三星在去年斥资 2.15 亿美元收购了 Viv。
2014 年,苹果在 Siri 中融入了机器学习系统,利用算法来提升它的表现。库伊将这套新系统比作大脑移植,他表示,这让 Siri 变得更加多才多艺,使之可以理解各种表述。例如,无论你说“告诉我洋基队昨天的比分”还是“洋基队昨天比分是多少”,它都能准确理解。
“Siri 这种产品的关键在于不用让你为了它而专门思考。”库伊说。苹果称,Siri 的错误率已经下降一半。
Echo 令苹果措不及防
大约就在同时,亚马逊推出了 Alexa 和 Echo 音箱,开创了新的领域,还利用亚力克-鲍德温(Alec Baldwin)主演的怪异电视广告展开地毯式轰炸。短短两年,这款音箱的销量就达到 1100 万台。
这款设备的流行令苹果措不及防。它不仅可以播放音乐,还能回答问题,甚至控制电灯和各种家电,而苹果直到最近才通过 HomeKit 软件系统引出了这个概念,让开发者可以设计能用 Siri 控制的恒温器和门锁。
iPhone 本应是一项巨大优势,但却成了发展障碍。苹果表示,每月约有 3.75 亿台苹果设备通过 21 种语言使用 Siri,这项服务每周大约处理近 20 亿条请求。仅在美国,它每周的独立用户就达到 7000 万。相比而言,亚马逊 Alexa 仅支持德语和英语,而谷歌助手也只能支持 7 种语言。
与此同时,为苹果贡献了三分之二营收的 iPhone 成为了内部的绝对焦点,导致苹果几乎忽视了 Siri 团队对虚拟助手的发展愿景,只是局限在日程安排和文本信息这些领域。
相反,苹果只是支持了更多语言,并在女声的基础上增加了男声,而且允许用户在用 iPhone 阅读文章或查看其他内容时口头创建提醒信息。Siri 前语音科学家、创业公司 Semantic Machines CTO 拉里-吉利克(Larry Gillick)表示,苹果和其他大型企业“都倾向于逐步改进”。
隐私保护反成短板
亚马逊和谷歌都在 2016 年推出了自己的语音助手。Siri 前员工表示,由于他们凭借各自强大的搜索引擎对语音助手进行了训练,而且不太受制于严格的隐私政策,所以比 Siri 更具优势。
为了保护用户隐私,苹果会随机标记 Siri 搜索,而且只会保留 6 个月的数据标记,这与谷歌和亚马逊长期保留用户数据的做法有所不同。Siri 前工程师表示,由于这种做法相当于放弃了数据控制权,导致苹果难以改进 Siri 的使用效果。
“你被打残了。”Siri 搜索团队前成员詹森-道格拉斯(Jason Douglas)说,“iTunes 商店有很多数据,但跟谷歌或亚马逊不是一个级别。”
库伊表示,苹果往往会使用通用数据而非用户的个性化数据对系统进行训练,因而无法借助 iPhone 上的个性化信息改进 Siri 的性能。
第三方对接不畅
在 Siri 接受了“大脑移植”手术后,改进 Siri 对话能力的计划便暂时搁置。苹果让语言处理专家亚历克斯-阿赛洛(Alex Acero)将语音识别和自然语言两个相互竞争的团队合并起来。第一个团队是让机器学会识别人类的语音,第二个则是解决这些语音的含义。曾经任职于语音识别团队的查克-沃特斯(Chuck Wooters)表示,经历了管理层的权力斗争之后,该项目又被交给一个缺乏该领域专业技能的人负责。
这一调整令一些语音识别专家感觉梦想破灭。沃特斯表示,一位专家跳槽谷歌,另一位跳槽亚马逊。沃特斯本人也加盟 Semantic,这家公司正在开发一种能让虚拟助手更加健谈的技术。
苹果拒绝对此置评,仍然任职于 Siri 团队的阿赛洛也没有发表评论。
其他员工也因为苹果迟迟不愿让第三方应用使用 Siri 而感到心灰意冷。苹果在 2013 年增加了一项功能,可以使用 Fandango 购买电影票,但两位前员工表示,斯塔西尔搁置了将 Siri 与更多第三方应用对接的计划。一位苹果前工程师透露,等到该项目两年后继续推进时,苹果已经减少了新的开发者可以使用的新命令数量。
去年 6 月,苹果在年度开发者大会上发布了大约 150 个新的 Siri 命令(他们称之为“意图”)。他们对 7 类应用开放了 Siri,其中包括付费(Venmo)和专车(Uber)应用。相比而言,亚马逊 Alexa 则允许开发者自主定制命令(他们称之为“技能”),目前的总量已经达到 1.2 万种。借助这些命令,用户可以使用语音订购咖啡、练习冥想、查看银行余额。
当时参加发布会的开发者布莱恩-罗姆勒(Brian Roemmele)表示,Siri 在命令方面的局限令很多开发者感到失望。“人们原本兴致勃勃地来参加会议,但最终却发现,‘我根本不能使用。’”他说,“有的人又恢复了原先的看法,他们认为 Siri 永远成不了气候,于是继续为谷歌和 Alexa 做开发去了。”
库伊表示,苹果选择向人们经常使用的应用开放 Siri,而且能够理解通过不同方式表达的各种请求。“这都是你每天都会用到的东西。”他说。
苹果周一宣布,开发者可以在笔记和银行等四类应用中使用 Siri。
准确率欠佳
Siri 在其他方面的能力也落后于竞争对手。数字营销公司 Stone Temple 表示,在 5000 个不同的测试问题中,Siri 的准确率为 62%,而谷歌助手和亚马逊 Alexa 都达到 90%。
市场研究公司 Loup Ventures 的另外一项研究表明,Siri 在 iPhone 核心功能上的表现好于对手。这些功能都与指令相关,包括制定日程安排、拨打电话、发送文本信息。不过,在回答网络问题时的准确度却相对较低。
苹果试图通过收购缩小差距。该公司 2015 年收购了英国创业公司 VocalIQ,后者设计了一款可以提升虚拟助手对话能力的系统。
一位苹果前工程师表示,他们的计划是通过该系统为苹果提供数据,从而让 Siri 更加健谈。例如,用户可以首先询问周围有哪些咖啡厅,之后还可以进一步缩小范围,从中挑选可以提供 Wi-Fi 的咖啡厅。
谷歌助手已经开始提供这些对话能力,但 Siri 仍没有取得进展。“我认为没有一家公司在对话上得到了A 的成绩。”库伊说,“这是个很有挑战的问题,这一领域有很多工作要做。今后会大幅改进,也确实需要大幅改进。”