文/戈振伟
文本是Facebook用户最为常见的交流方式,想象一下,如果有一款产品能够随时随地理解Facebook用户交流时的文本信息,理解用户表面或潜在的需求,在用户还没展开搜索的情况下就及时自动提供用户所需的兴趣内容或服务,这将大大提升Facebook用户的体验。就在国际六一儿童节这天,Facebook正式推出基于深度学习技术的文本识别人工智能搜索引擎Deep Text,一款可以满足你上述想象的智能产品。Deep Text源自于Facebook AI Research小组,运用多种深度神经网络架构,包括卷积式与回馈式类神经网络,可进行文字与字符层级的学习,再以深度学习平台FbLearner Flow及深度学习演算架构Torch进行模型训练。它能够以接近人类识别的精确度每秒识别成千上万条内容,并跨越 20 多种语言。这里会包括常见的英语、西班牙语等等,但到底支不支持中文,目前Facebook并未作出透露。
Deep Text本质是一款人工智能搜索引擎
为什么强调Deep Text是一款人工智能搜索引擎呢?笔者认为,搜索的高级阶段是自动管理和组织知识。全球搜索老大Google的使命便是整合全球信息,组织全人类的知识,但过去以Google为代表的传统搜索引擎仅仅是处于搜索的初级阶段——只能找到而不能识别信息。不过从谷歌、百度等搜索巨头近年来积极拥抱AI的行动来看,互联网时代的搜索引擎正在向人工智能时代的搜索引擎过渡,正逐渐走出搜索的初级阶段,向更高级的阶段迈进,这意味着以后的搜索引擎不仅能发现信息,还能识别信息,发掘信息背后的知识,并自动管理和组织知识。
在笔者看来,Deep Text的本质正是人工智能时代的搜索引擎。互联网时代的搜索引擎是有形的,比如一个搜索框,是看得见的,需要用户主动去搜索才会发生作用;人工智能时代的搜索引擎是无形的,是隐藏在终端背后看不见的,能够快速理解用户需求并自动搜索给出答案。
Facebook机器学习团队的工程技术主管Hussein MeHanna 表示:“我们希望将 Deep Text 运用在对 Facebook 平台上的海量内容进行分类,从而让搜索内容变得更加容易,同时为用户呈现他们感兴趣的内容。”
Facebook 表示,Deep Text 目前已经在一些方面开始发挥作用了。例如,Facebook Messenger 上的一些聊天机器人现在已经能够基于用户发的聊天内容理解他是否需要叫 taxi。如果有人在聊天里发 “我需要叫辆车” 给其他人,聊天机器人就会插话问是否需要帮他叫俩 taxi,系统可以自动匹配出Uber、Lyft等专车的信息,或是给出天气预报等内容。如果有人发 “我是坐出租车来的”,聊天机器人就知道不需要叫出租车了。这个例子可以看出,用户如果需要打车,不用再特地主动去搜索打车服务了,Deep Text能够在后台根据用户聊天信息自动识别并提供相应服务。
除了识别聊天内容,自动搜索给出建议之外,Deep Text 还会用于 Facebook 上的垃圾消息清理。它会去识别 Facebook 上发布的内容,并且会判断这条销售是否为营销帖子、垃圾信息。如果碰上这些内容,Deep Text 将会自行删除。这些都可以说明Deep Text能够自动管理和组织信息知识,尽管它的管理和组织能力还有待提高。
未来,Facebook还希望Deep Text还能够识别对话中的人物信息、地点信息,相关事件等,从而更好得理解用户的兴趣,给用户做出更加个性化的推荐。同时,除了文本内容,也要能够识别视频内容。
Facebook做搜索是顺理成章
事实上,Facebook做搜索也是顺理成章。当现实世界中发生了重大事件,人们往往会在Facebook上进行搜索,看好友们对于事件的反应。扎克伯格也曾对投资人表示,将会在搜索引擎领域和谷歌正面竞争。毕竟,基于自身海量的用户社交数据(月活跃用户数量为16.5亿),Facebook相对于传统搜索引擎更清楚每一个用户的兴趣、偏好,能够提供更具个性化、效率更高的搜索结果。在去年10月份,它就对外发布了一个全新的搜索引擎“通用搜索”(Universal Search),显示出Facebook进军搜索领域的决心。
但目前Facebook服务器存储的大量都是非结构化的数据,这意味着Facebook需要对这些数据信息进行深度学习、解读,做好标签和分类,形成结构化数据,才能转化为可以有效利用并且可以供用户搜索的信息,而完成这步关键步骤的便是Deep Text。
Deep Text是搜索引擎的一次进化,搜索引擎植入AI已成为行业的新态势
Deep Text是搜索引擎的一次进化,意味着越来越多的AI植入,越来越智能,能够快速筛除垃圾重复信息,满足人类亘古不变的更快捷更有效地获取信息的刚需。不难发现,搜索引擎植入AI已经成为行业的新态势。谷歌在不久前结束的开发大会上推出了全新的“谷歌助手”(Google Assistant),谷歌助手能够“隐藏”在聊天用户的身后,自动分析并搜索给出信息内容。百度在2015年的百度世界大会上推出度秘(英文名:duer),且已经内嵌到百度搜索引擎中供用户正常使用多时。
作者介绍:戈振伟,互联网实验室分析师,关注“互联网 ”和人工智能。微信号:gezhenwei。
责任编辑:王超_NT4133