全球虚拟歌手市场一直由日本引领,最知名的便是初音未来。作为全球第一虚拟歌姬,初音未来一出道就一战成名。今年的淘宝造物节,初音未来演唱了《Chainning Intention》、《Tell Your World》等,其逼真的表演一度令人忘记她究竟是机器、程序、还是人。
不过,当16岁的元气少女初音未来为准备淘宝造物节而学习中文时,微软小冰已经有中文版了。作为一名人工智能“软妹”,微软团队赶在小冰行“成人礼”前,为我们带来了第四代小冰。这是一款包含实时情感决策对话引擎、具有多种新感官、中日英三种语言的人工智能机器人。
微软称,“小冰”在业内拥有文字、图像、视频等完整的感官系统,大量的交互,使过去中文语音系统中中英文混杂,机器人念儿化音等问题都得到了解决。并且,除了撒娇卖萌外,18岁的微软小冰又get了一项新技能:唱歌。
与初音未来的电子合成乐不同,第四代微软小冰在经过6个月长达几百次训练后,能自动完成相当合格的流行歌曲演唱。比如《隐形的翅膀》,声音虽略显稚嫩,个别歌词咬字发音也称不上完美,但音准与情感表达接近人类。不知道初音未来与微软小冰PK,谁胜?
目前,微软已与湖南卫视女子团体综艺节目《夏日甜心》合作,发布首支由小冰演唱的人工智能版节目主题曲。今年9月,微软还将在日本为小冰推出首支原创单曲,考虑未来让小冰进军虚拟歌手市场,比如邀请虚拟歌手爱好者和公众进行歌曲演唱与创作。
微软在研发中发现,情感会影响人们的决策。于是微软将小冰定位为情感聊天机器人,希望能与用户进行足够多的情感交流。这次,小冰新增了全新的“全时感官”技术,它可以实现类似科幻电影中人工智能与人的无缝流畅通话。例如科幻片《Her》中,作家西奥多失恋后,人工智能操作系统“萨曼莎”安慰他的场景,微软小冰也可以做到。
这个功能得益于微软开发的DirectChat技术。该技术能使小冰根据聊天内容与走向,通过70%以上对话内容的上下文情境,与人进行直接对话。最神奇的是,二者的通话甚至能相互打断与追问,极大地实现了拟人的实时交互体验。这一功能将在近期向公众开放。
小冰快速成长的背后,离不开大量的练习。据悉,去年11月至今,小冰发布的每条美拍视频平均可得到超120万的播放量和2万条弹幕。
最新数据显示:截至今年5月,小冰已拥有超过4200万用户,平均对话长度达到23轮,图像等多感官的对话也已超过2亿次。这被外媒称为“全球科技史上最大规模的一次图灵测试”。
人工智能被认为将是未来10年全球科技领域和互联网行业创新的主要增长点,在微软看来,人工智能属于人与世界之外的第三极,并将成为连接二者的桥梁。
正是基于这样的考量,微软将小冰定义为公司的一款战略型产品,代表其未来人工智能的发展方向。在微软内部的Windows 10、Office 365、Hololens等产品线上,都有考虑和小冰进行合作。
此外,小冰还推出了虚拟卡槽平台 特定技能卡模式。对小冰说一句“插上电影卡”之后,她可以和你分享电影的知识,知道你的喜好,并且推荐适合你的电影。类似的功能还会出现在时尚、美食、音乐等领域。
在商业化上,目前微软已经在为日本第二大超市集团LAWSON提供小冰的托管服务。微软还希望将这些解决方案覆盖到微信、微博、LINE和Twitter等平台上。在国内,微软与敦煌研究院合作,小冰将为消费者及时提供敦煌门票、历史典故等方面的信息服务。
中国互联网行业竞争的激烈程度超过美国,小冰项目被视为微软中国本地化战略上的一次创新。微软认为,如果这个产品如果能够在中国市场上得到认可,公司对国际市场的推广会很有信心。为了推进这个计划,微软还将常规产品的30-36个月开发周期缩减至6个月。
这几年,不少人工智能平台都已经把情感计算视为一种基本框架,在IQ之外,它们也开始关注产品的“EQ”。一个能解决问题的人工智能助手,最多只能算作一个底层工具。未来想走得更远,微软小冰还需要向用户展示更多人性化的功能。