游客

携程要“为你写诗”,看似不务正业的背后带去多少利润?

游客 2017-06-26 15:22:09    201092 次浏览

携程要“为你写诗”,看似不务正业的背后带去多少利润?

这年头怎么去改变,不仅是创业公司负责焦虑的命题。尤其当人工智能的锦旗竖立在漫山遍野,似乎每个公司都想高举着杀出一条血路。

携程则在去年悄然上线了一款 AI 产品“小诗机”,顾名思义,就是帮助用户写诗的软件——用户只要上传风景照,后台人工智能系统就能结合用户图像,写出一首诗。携程方面的说辞是,大家都在讨论“诗”和“远方”,携程一直在帮用户解决“远方”的问题,现在开始作“诗”了。尚不考究新品最初的意图,我们跟携程人工智能负责人于磊聊了聊,来看看这款“不务正业”的产品给携程带去的变化。

小诗机的原理

粗略来看,小诗机要实现得分两部分,一是要“认识”图片上的景物,再就要像人一样能写诗。

首先用到的是图像识别技术。小诗机采用 CNN 深度神经网络,能够识别景物、人物类别超过 1500 种,包括人物的性别、年龄及神情等。不过,要进一步识别出一座塔是“雷锋塔”还是“六和塔”,一条河是“莱茵河”还是“尼罗河”,就比较困难。

接下来就得搭建全面的景区知识库,需要包含各景点的专属特征。此前携程积累最多的是景点照片和用户评论,离特征库还有一定距离,所以机器先要通过大数据 人工智能,对全球成千上万个景点进行特征挖掘,不仅包括景点的名称,还有景区房顶的形状、墙体颜色,当地美食、名酒、名茶,风俗习俗等全面的知识图谱。如此,经过训练后,再结合用户的地理位置等维度的信息,机器就能识别出具体景点。

而在写诗方面,于磊坦言,“写诗比较容易,但写好诗就困难了。最初写出来的东西,有诗的样子,但实际上读不懂。”好在小诗机本身是一个综合的人工智能系统工程,有海量的知识库,也有深度学习的 CNN、LSTM、翻译模型算法、遗传算法的调优,经训练小诗机可以把一些自然语言抽象成诗句用词。例如,“高高的房顶”,“白白的墙”,“漫山遍野的樱花”这些属于自然语言,放到诗里就成了“白花”、“尖顶”等。当然,这是在训练了近 30 万首现存的律诗以及 300 余本中外小说的基础上,才成型的。

随着产品发展,还有用户会上传人像照片来进行写诗。所以小诗机又建立了人物知识库,主要覆盖娱体、商界的名人,以及携程数亿用户的用户画像,包括名人的年龄、性别、职业、代表作品、性格风格等,普通携程用户的出生地、年龄段、性别、常驻地和喜欢的旅游项目。据悉,在内测版本中已经实现,正式版会在下一期上线。

携程背后的人工智能

于磊于 2015 年加入携程,开始组建大数据部门,希望通过 NLP、人工智能等技术发展携程业务。“其实小诗机在立项之初,关于应用场景没人想太清楚,表面上看也没有给携程带来直接收益,但是小诗机在全球景点知识库的构建、人工智能、图像识别等领域技术储备和基础建设,却让携程在 OTA 行业提升了竞争力。”于磊如是说。

正如上文所提,之前携程积累的大多是分散的非结构化数据,像图片、评论之类,但借着“全球景点知识库”的搭建,携程可以把景点标签化,再结合用户的兴趣标签,就能做聚类分析,按用户选择的时间段和价位,帮用户找出最优的目的地、出行时间、最优的机酒景组合方案。也就是说,小诗机的底层可以演变成“智能导购系统”。像携程现在的发现栏目,就是在用该技术做支撑。

其中,基于兴趣的推荐引擎,是依靠小诗机对深度学习的积累,据悉,该技术还被 2017 年 2 月份旧金山的 AAAI 人工智能顶级会议录用和宣讲。并且据于磊透露,携程下一版会上线“一条街”模块,根据用户所在地推荐附近的吃喝玩乐。

同时,像图片识别所用的 CNN 技术,也开始应用在携程酒店、攻略图片的处理中。而写诗过程中所积累的文本处理技术,像长短语义分析 LSTM、RNN 等也在客服机器人项目中开始落地。

大数据的间接变现

当然,企业的每一次业务涉水,最后都要落地商业变现,更何况,现在的大数据投入,不管在研发上还是人才上都是一笔不小开销。

于磊告知,携程的大数据部门目前有 40 多人,主要的任务就是帮助业务部门提升业绩。根据 ABtest 的结果来看,在有大数据支撑的栏目中,用户黏性提升了 80%,结合人均毛利,大数据部门去年给携程带去约 1.5 个亿的利润。

此外,我们还得知,携程的人工智能技术,不仅在自身业务中有应用,而且还部分开放给外界。例如,像法定节假日,国内的景点通常人山人海,携程则能根据过去的数据积累,预测未来景点的人流、价格情况,从而引导用户错峰出行,或者去到人口不那么密集的优质景区。再例如,携程还跟地方旅游局合作,通过大数据平台对用户画像进行分析,了解了消费群体的行为后,就可以合理化发展,比如说指导景点不需要重复建设等。

内容加载中