骑猪兜风

大数据背后,不可忽视的“人”

骑猪兜风 2016-06-06 15:11:26    200813 次浏览

当下中国,大数据是个热词。

无人汽车、人工智能、生物医疗,各种新科技中,大数据的身影无处不在,它像一把万能钥匙,开启了很多不为人知的空间。

但在人们热捧大数据的同时,却往往就数据论数据,甚至陷入数据膜拜,而忽视了大数据背后的人的因素。大数据是怎样发挥价值的?那些不会说话的数据又是怎样讲述鲜活的故事的?关注到腾讯近日发布的大数据报告《95后迷之隐私观大揭秘》,记者走进位于深圳的腾讯总部,走进那些让数据“活”起来的人。

大数据给不出解释

搞大数据研发,不就是坐在实验室、电脑前,整天对着数字噼里啪啦地运算?可腾讯公司用户与市场研究中心调研员韩娜,更多地是奔波在见调研对象的路上。

韩娜讲了一个对于她来说“家常”的故事。

一年冬天,她从南方的深圳赶到北方的沈阳,约了一个孩子做用户调研。本来知情的父母临时有事不在,孩子的姑姑不让韩娜进门。韩娜拿出身份证、工作证、介绍信,反复解释,但所有证明一概无用,对方就是不肯相信。

最终,韩娜被“砰”的一声拒之门外。

类似的经历,韩娜所在的团队几乎人人都遇到过。

很多人不理解,一个互联网公司怎么还用上门调研这种“老土”的方式?

的确,拥有7.62亿月活跃微信账户、8.77亿月活跃QQ账户的腾讯,并不缺乏用户社交的大数据,但光有数字就行了吗?

“大数据给出了结论,但给不了解释。”用户与市场研究中心总监谭池举了一个他自己的亲身经历。

多年前,他曾经参与过早期苹果手机一代的调研。当时,老外们通过大数据惊讶地发现一个现象:苹果的几种输入法中,中国人特别偏爱某一种。可是老外想不通,这是为什么?

谭池说,“为什么”往往是大数据的盲点,而产品改进的关键,有时候恰恰就在于这个“为什么”。想要找到答案,目前,还只能依靠传统的人对人询问。

当时,经过传统调研,谭池找到了原因:中国抽烟人口比西方国家多,许多公共场合更是想抽就能抽,人们一只手拿烟时,只好单手握着手机打字,因此中国的苹果一代用户,特别偏爱单手型、单指型的输入法。知道这个“为什么”以后,相关产品的开发,开始更多考虑单手模式了。

数据会抛出许多令人惊讶的结果。但结果意味着什么,人们仍然一无所知。可以说,人与人交流的传统模式,不仅没有被掩埋,反而在大数据时代,被一个个数据又激发出来。

大数据读不出场景

“滴”“滴”——访谈室里充满此起彼伏的电子音。研究员们有些震惊。

事情缘起于产品经理想做一个无障碍功能的设计。研究员朱丹招募了6位盲人进行访谈。起初,大家做好充分准备,以为盲人们可能不会使用智能手机,不会用APP,需要先教一下。

但没想到,这群盲人使用互联网产品相当熟练。他们利用智能手机的读屏功能,并且每个人都把声音调到最快档,只听见手机发出“滴”“滴”这样短促的电子音,常人的耳朵根本听不懂是什么,但6位盲人却在怪诞的声音中,熟练地使用互联网,让在场的“小伙伴都惊呆了”。

“原来网络对他们的帮助比我想象中大很多。”朱丹感慨。有位盲人告诉她,比如移动支付,对正常人来说只是多了一种支付手段,但对他们而言是一种颠覆式的设计,大大方便了盲人消费。

大数据往往会这样,提供了一个结果,但它并不知道用户在使用产品时,身处什么样的场景,怀揣怎样的心情,有着怎样的需求。这一切,唯有人与人面对面,才能知晓。

还有一次,谭池找到了成都的一名用户,兴高采烈跑到对方家里。目的是为了知道,用户使用产品时,真实的生活场景什么样。一番交流和观察后,他忽然觉得不太对劲:这户人家冰箱里只有6罐可乐,没有多余的食物,房间里也找不到水壶或饮水机。谭池发短信给同行的同事:留意一下,这是不是他真的家。

等到双方聊得很开心以后,对方果然露出了口风,原来他确实不住在这儿,这间屋子的主人是他父母,目前租给别人,这次为了接受调研,临时借用了一下。

“这样一来,我观察他的生活场景,有一半信息就没用了,比如小区、邻里关系等。”谭池遗憾地说。

进一步说,比起直接的数据,如何解读数据背后的意义,才是把大数据用“活”的重头戏。用户真正的使用情景,他们的担忧、开心、困惑与不爽,目前的大数据读不出来。数据再大也是死的,只有人能激活它。

大数据不知道怎么做

多年前,有一位调研员曾经接过一个项目,对方要求调研某产品在用户心中是多少分,如果得分在80分以下,整个相关团队就要被撤销。“其实,给79分还是80分,有很大区别吗?”谭池反问,“不谈评分机制,就算根据数据得分,判了一个团队的生死又怎样?问题还是在那儿,依然没有得到解决。”

大数据本身,并不能给出一个既定做法。面对数据运算的结果,之后的步骤可能更加重要。

调研员小迪同时负责1-3个调研项目,一般9点半从公司出发,去深圳市里与用户一对一访谈。中午回公司,下午另外一个项目的招募和策划会议又开始了,当中偶有空隙,他就回到座位写一些访谈总结。这就是一名调研员每天的工作日常。

每一年,研究中心负责调研的项目数以百计,这些课题并非调研员自己“拍脑袋”想的,大部分来自产品策划的需求方,比如产品经理,改进一个产品功能时可能会冒出一个问题,希望通过调研来解答。

韩娜说,刚入这一行,自己与产品经理交流时,经常需要磨合。比如一位产品经理很纠结,关于“签到”有两种改进方案,究竟95后用户更喜欢哪一种呢?他不知道。他可能先去找数据师,去调相关的大数据。大数据显示,95后更热衷于每天上网“签到”。但是他们“签到”究竟是出于什么心理,获得了什么满足,数据并不懂。

于是,产品经理接着找韩娜,请她进行用户研究。结果显示,95后乐意“签到”,更多是为了满足自己的情感需求,尤其是“刷存在感”。可是知道了这一点后,产品经理依然无法抉择,究竟哪个方案更好。

时间久了,韩娜渐渐明白,自己做完调研,不能仅仅解答“为什么”,“用户怎么想”,还要给出“怎么做”的建议。

当然,再细致的调研,最终也不一定能找到产品经理想要的答案。有时候,答案是有了,但考虑到成本营收、缺乏供应商、缺乏可操作性等因素,改进方案依然不了了之。大数据和访谈就都白做了。

另一位调研员马建说,自己工作最开心的那刻,就是调研的建议被采纳,最终体现到产品中。

今天的企业、政府,乃至整个社会,很容易通过大数据对市场一目了然,但一目了然之后怎么做?漠视它、改正它、还是适应它?

大数据未必懂得价值

罗英、何文是“数据挖掘师”。但这份工作想做得好,单纯依靠算数据并不够,其实还要动用“情商”。

比如,QQ音乐有一个功能叫“猜你喜欢”。根据用户的数据,软件会自动推荐一些陌生歌曲,它们往往符合你的音乐品位。这种推荐,显然是基于大数据平台。一般我们以为,只要提供一些算法,大数据平台照此运算就成,但事实没那么简单。

首当其冲的是准确率。“猜你喜欢”究竟能猜对多少首歌?不同的数据师,可能会设计不同的算法,有的人效果明显比较好,他把“年龄”的数据用起来,而另外一个人没用,就会导致两者准确率差很大。

究竟需要考虑哪些数据维度,荐歌才会最符合心意呢?没有标准答案,不同数据师有自己的判断。同样的大数据库,一个运算下来比较准确,一个不准,其中唯一的变化就是人。

第二个问题是,为什么有人能想到“年龄”,而有人却想不到?凭借的也是个人经验。或者说,凭借的是人对事物的理解,考验的正是数据师的“情商”。

“在我们行内有一个不等式:业务知识>数据>算法。”罗英解释,“而业务知识就是你的理解能力。”用同行的话来说,就是“你的架构是否合理。”

没什么课题的时候,数据师的常规工作十分枯燥。

每天上班第一件事,就是低头看手机。手机上,已经装有数据展示的平台,到点就会自动发布一些基本情况,比如当天登录用户数多少,这些已经无需太多人工干预。

然而一旦看出今天的数据有异常波动,数据师就要马上查找原因,比如去各个相关部门询问,是不是因为今天有大型活动?如果有,那算是幸运的。比较棘手的情况是,今天更新了一个新版本,而用户在新版本上,上传照片的完成率很低,那也是一种异常,需要赶紧找原因。

如果产品经理提出一个课题,需要与小伙伴们凑在一起开会讨论,那数据师的工作会稍微有趣些。

比如最近,产品经理提出:能不能根据大数据,观察每座城市的人口迁移,随后做一份《城市年轻指数》报告?

策划会上,数据师们给出了这样一些数据:用户的登录地,再比对他们的年龄信息等。最后给出来的数据,大家一看都觉得有价值,《城市年轻指数》报告就这样出炉了。

当然,更多时候,理想很完美,但运算出来的数据却没什么变化,被判定“数据价值不大”,议题便会不了了之。

“大数据就好像是一杯水,我们需要去厨房煮菜,水只是材料之一。我们不能直接把水卖给客户,我们需要煮好一碗菜,才能端给客户。”罗英形容。

何文则说,他工作的成就感,不在于运算大数据,而在于最终“能给出有价值的数据”。

大数据还能做什么

第一张与家人的合影、第一张旅行的照片、第一张宝宝的笑容……

已经活跃了11年的社交平台QQ空间有着丰富的用户数据,最近,腾讯运用这些数据,为个人生成一份“社交回顾互动”H5,比如显现出你第一次注册空间的时间,跳出第一张上传的家人合照。

“其实也捏了一把汗,这对图片的数据解读要求非常高。”从事QQ空间运营的琪琪说,“试想,第一张与家人的合影,万一大数据判断错误,跳出来的照片是与男同事的合影,岂不是很尴尬?”怎么抽取数据,让数据判断准确很重要。

小迪做调研时遇到一名初中男孩,对方很有倾诉欲。男孩告诉他,自己有5个QQ号,4个已经被妈妈“破解”了,可能是因为密码太简单,都是生日之类,妈妈太容易猜到。于是他想出了第5个QQ密码,复杂到连自己也记不住。他把密码放在带锁的储钱罐里,再把储钱罐藏在床底下,每次用这个账号登录QQ时,他都要先从床底下把密码翻出来才行。即便如此,为了屏蔽父母,他还准备再注册一个账号。

这个故事,后来被小迪写进了《95后迷之隐私观大揭秘》报告中。该报告揭示,95后是一群非常注重隐私的群体,近4成95后认为,自己的隐私遭到过侵犯,他们为了保护隐私采取过各种小手段。

然而隐私报告诞生后,也让一些媒体和学者产生了危机感。报告既有大数据的样本分析,这点比高校科研的取样还大;又有案例故事,这点又与媒体的角度重合。长此以往,是不是一家互联网公司就能自己完成科研报告了?大数据会不会让一些科研机构被取代呢?

除了活动、推荐、科研,大数据目前已经用来进行精准的广告投放。比如一个平台,经大数据分析,把1000万流量分成两半,一半是对汽车感兴趣的人,一半是对奶粉感兴趣的人。只需要把500万流量给车商打广告,它的转化率就非常高。

而最让人期待的是,大数据在某个领域正发挥着超乎想象的作用——城市公共空间的实时数据检测。

类似功能,其实微信上已经有了。打开微信个人钱包,选择城市服务,右下方有一条“城市热力图”。点击进入,热力图能实时显现你所在的位置附近,有多少人流,它意味着交通是否拥挤。当然,扩大使用的话,它还能实时监测某块区域,是否短时间内人流密度过高,及时提出预警。

也是基于相同的原理,近几年腾讯发布了春运迁徙报告,实时监测每年春运的迁徙情况。

以上这些,都是已经使用大数据的方面,而未来,很多人都对大数据赋予了想象空间——

当每个人的身体信息都能被实时收集,形成个人的大数据时,人会怎样?当整个社会被大数据连接起来,形成一个庞大的系统,不仅交通、运输,整座城市管理,都可以用大数据运算出一个“最佳方案”时,城市又会怎样?

我们已经迈入一个大数据的时代。有人说,终究有一天,数据的价值将超过土地的价值。但是也有人说,世界就是一个“黑盒子”,永远无法窥探内部的秘密。

远古时代,宇宙对于人类就是一个巨大的黑盒子。如今,科学技术正在解开一个又一个黑盒子,可是大数据的终解会通往哪里?目前依然没人说得清楚。

“技术是有局限性的。”当我们一直在展望科技的无限可能时,反倒是这些一直与大数据打交道的人,不断强调着这一点。

(文中的人名均为化名)

对话

人始终无法被替代

解放周一:企业对大数据的估值一直都很高,不会轻易公开。你们怎么会想到免费对公众发布一些大数据的社会报告?这本身就是一种试验吗?

李航(腾讯集团市场与公关部总经理):这几年,社会上的大数据报告很多,每家互联网公司各有偏重。

社交平台本身就是一个浓缩的小社会,社会的新变化、新趋势,都会在这个平台有所反应。比如,大家越来越觉得,当代年轻人变得无法定义了,他们似乎喜欢追星、喜欢消费,他们究竟是怎样一群人呢?能否做出一些描述?那么,在我们的社交数据平台上,是否可以观察到年轻人的一些变化?意识到这是一个社会共同关注的话题,我们就基于大数据发布了相关的报告。

另一方面,大数据是个很大的盘。但是这个大盘上也可以有许多小的切面和故事。大数据未必一定要生成一个宏观的大报告,从特别的角度切入,以小见大,也是一种尝试。这次我们推出95后的隐私观,那么下次可以继续推出当代年轻人的审美观、择业观等,持续聚焦一些可长期跟踪的社会话题。

解放周一:这份报告既有宏观数据,又有微观故事,看起来似乎“抢”了高校和媒体的活,您觉得,你们做的调研,与高校和媒体的调研本质区别在哪里?

李航:我们是一个平台,也许从能力上,我们可以做到像高校那样,或者像媒体那样,但从自身的定位来说,我们尽量只做平台该做的,那就是客观陈述。有些洞见,不轻易进行价值判断。社会现象一击即中讲清楚即可。这些大数据发布出去以后,如果高校、媒体引用,进一步就这个社会现象深入分析下去,我们也很高兴。

大家知道,腾讯一直在做平台服务,提倡“开放”,这个思路也适用于传播。我们现在的社会类报告,大数据依然是开放状态,未来外部机构可以一起策划做下去,共同搭建一个挖掘数据价值的生态圈。

解放周一:是不是因为互联网行业变化太快,所以你们对社会的细微变化很敏感,也因此对调研投入了很大精力?

李航:Pony(指马化腾)曾经说:巨人倒下的时候,身体还是温的。互联网这个行业,分分秒秒都在变化,特别让人敬畏,所以我们始终有一种危机意识。基于此,我们专门有课题研究社交如何改变人。今天,我们愿意开放一部分资源和数据,也是希望能与全社会一起去解读互联网的动向,可以说是为了社会,同时也是为了我们自己的生存前景。

解放周一:那么您对大数据的未来怎么看?有了人工智能、深度学习,未来人还有用武之地吗?

李航:目前看待和处理大数据有几种方式。一类是对年龄、性别、星座等基础结构型数据进行呈现和总结。第二类是视频数据、语音数据、图像数据。我们有像优图这样世界领先的技术团队,他们在音频、人脸、图片识别等领域都有深入研究。现在我们正在研究,如何让语音数据与图像数据结合进行分析。第三类就是人工智能,它的想象空间非常大,或许通过深度学习,未来人工智能自己会对数据产生洞察力,理解数据背后的意义、原因、提供建议,一切皆有可能。

未来也许人机之间有新的协作模式,但我相信人无法被替代。人性很复杂,即使人与人的当面交流,所知也是有限的。人的情感、动机、心理,这些都是目前机器解读不了的。

越是与大数据打交道,我越是对人性保有敬畏之心。

内容加载中