骑猪兜风

面带微笑会让你更开心?倒掉这碗心灵鸡汤吧

骑猪兜风 2016-09-21 10:08:23    201110 次浏览

(原标题:著名“心灵鸡汤理论”被证明不可重复:面带微笑不见得让你更开心)

心理学界公认二十多年的正统理论被最近的重复实验推翻了。

面带微笑会让你更开心?倒掉这碗心灵鸡汤吧

1988年,德国维尔茨堡社会心理学家Fritz Strack做过一个经典实验:面部动作可以改变心理状态。面带微笑会让人快乐,苦着脸会让人情绪不佳——情绪不仅可以内而外,也可能由外而内,由自身的动作引发。二十多年来,作为社会心理学的经典研究之一、“社会启动”(social priming)理论的典型代表,这一直是心理学公认的正统理论。

然而2013年春天,63岁的Strack在一系列私人邮件提出了一个大胆的建议:如果怀疑者想要检验什么东西,就应该让他们去检验。在科学领域,“论述的质量及其实证检验才是科学著述的根本。”

在 Strack 提议之时,社会心理学领域正处于困境。著名的社会心理学家 Diederik Stapel 深陷造假丑闻,而“社会启动”的诸多研究,也在仔细的审查中暴露出问题,许多人希望对社会启动领域的论文进行大规模验证。

所谓“启动”,是指人不会意识到一个在短时间内(比如3毫秒)呈现的信息,但是大脑接收到信息,对其进行了处理。“社会启动” 这个概念本身就很微妙。心理学实验依靠精心设计的实验条件来反映人行为的细微变化,实验设置的轻微改动,或是实验室新手犯下的小错误,都有可能扭曲数据。假设有一个或者几个实验室无法复制前人的研究,那能说明什么问题呢?这会改变人们对于科学的看法吗?

诺贝尔奖获得者、心理学家 Daniel Kahneman 对《自然》(Nature)转述了他对“启动”研究的看法:他希望鼓励该领域专家进行复制研究,但是他们却不肯;这就“诱使人产生这样的联想,启动效应的信奉者害怕看到复制研究的结果”。

于是 Strack 说,让他们去检验他的那项教科书式的研究结论吧。

那么,Strack 的理论具体是什么?

在不久前的里约奥运会上,摄像机拍到运动员菲尔普斯皱着眉头的样子。菲尔普斯是不是在进行什么神秘的准备活动呢?

面带微笑会让你更开心?倒掉这碗心灵鸡汤吧

一个神经科学家解释道,他可能是在用“面部反馈”(facial feedback)理论的方法,通过扭曲面部肌肉来激活杏仁体,为比赛做准备。多年来这一直是自我调节的标准方法。想要感受什么情绪,就先做出那个表情,接着那种情绪就会自然而然地产生。

这个理论可以追溯到达尔文时期。达尔文在1872年提出,情绪表露出来的动作和表情可以进一步强化这种情绪。那些在生气的时候动武的人会更加生气。达尔文把这个理论归功于法国脑解剖学家 Louis Pierre Gratiolet。此人后来进一步提出,动作和表情不仅仅可由情绪触发,甚至可以反过来触发情绪。

这个关于身心一致性的理论在经过美国心理学之父,心理学家 William James 以及之后的心理学家的一步步扩充和演绎之后,内涵变得更为丰富。上世纪60年代,有心理学家提出,其机理在于从现象中寻找原因:人们感觉到出汗,会观察环境是否太热了,同理人感觉到笑的动作,也会推想自己是不是很高兴。

后来研究者实验验证发现,面部反馈似乎真能改变人的情绪。但是没人清楚面部反馈过程究竟是如何发生的。

80年代,Strack 在伊利诺伊大学做博后期间注意到这个问题。他发现,此前所有的面部反馈研究都有一个共同的缺陷:参与者很容易猜到实验目的。如果实验人员让你笑,你多少能了解他期待你感受的情绪。这样一来实验数据就受到了污染,因为催生实验结果的原因可能并不是面部反馈本身,而是参与者对实验目的暗示的顺从。Strack 和同事 Leonard Martin 知道,自己的实验必须要更加高明。

他们想到,可以让参与者用牙齿咬着一支笔,或是一支温度计。用牙齿咬着笔的人,嘴巴必须张大,看起来就像在假笑!但如果让他们用嘴唇吸着笔,他们的眉头就会不自觉地皱起来,看上去很不高兴。这样一来,参与者根本想不到实验目的是什么。

面带微笑会让你更开心?倒掉这碗心灵鸡汤吧

他们告诉参与的92位本科生,这是一个关于“精神运动协调”,以及有身体残疾的人是如何写字和使用电话的实验。接着学生们用牙齿咬着,或是用嘴唇吸着笔做了一些无关的任务,比如用铅笔把点连起来,或是把一段文字中的元音都标出来;最后他们评价了一个卡通的搞笑程度。

他们的结果发现,那些用嘴唇吸着笔从而被迫做出皱眉表情的人,给卡通片的平均分是4.3;而那些用牙齿咬着笔从而被迫做出微笑表情的人,给卡通片的评分却是5.1。最重要的是,实验中没有任何学生觉察到自己的面部表情被操纵了。他们根本不知道研究的目的是证明表情对卡通评价的影响。

这个聪明的小伎俩看起来一劳永逸地解决了面部反馈的研究难题。很快有记者来追问他,是否能用这个方法治疗抑郁症,不过 Strack 说,要让一个人快乐,有的是更好更强力的方法。

在接下来的20年里,有许多其他实验室运用了这个方法并进行了改良。有人把一对高尔夫球钉(放高尔夫球的支架)分别粘到参与者的眉毛上,然后让他们把两个球钉靠在一起,使得参与者被迫做出皱眉的样子。似乎这个动作能够让参与者感到悲伤。在另一个实验中,研究人员让参与者用5种方法衔着笔,以使后者做出5种不同的笑容,比如礼貌的笑、假笑、更自然的挤眼笑等等。这个研究称更真实的笑容让人感到更快乐。

Strack 和 Martin 的方法后来得到了各种稀奇古怪的应用,甚至进入了实践操作领域。有人猜测,如果面部表情能够影响一个人的心理状态,那么微笑是不是能够治好社会痼疾呢?有一项研究给出了肯定的回答。2006年,芝加哥大学的研究人员发现,如果你让人们微笑(让他们两排牙齿间夹一支笔)的话,他们看到黑人照片时的种族主义倾向会减弱。2013年,西班牙的一个研究团队发现,牙齿咬着笔的“笑容”能够让人在画画任务中变得更加有创造力。Strack 自己甚至在一个实验中证明,如果让学生皱起眉毛来的话,他们就会觉得明星也并不是那么有名。甚至 Strack 本人曾一笑置之的抑郁症治疗问题,也颇有建树——最近一些随机临床试验发现,注射肉毒杆菌毒素消除皱纹,可使病人从抑郁中恢复。

回顾这些年的各式研究,Strack本人对该理论深信不疑。这就是为什么三年前他主动请缨的原因。“他们想要复制些研究,所以我建议他们重复我的面部反馈实验,”他说,“我有自信肯定能得到积极的结果,所以我并不觉得这事儿会变得多么有趣。好啊,他们想做那就做吧,我没有问题。”

负责这项面部反馈复制计划的是荷兰阿姆斯特丹大学的 E. J. Wagenmakers 。他对情绪以及情绪的表达没什么兴趣。“我的兴趣主要在方法上面,”,科学是人做的,“是人就有可能会有各种偏见。我想从整体上讲有理由持怀疑态度。”

复制出研究的机会有多大呢?

“我估计有30%吧!”

从某种意义上讲,Wagenmakers 的估计算是乐观的。因为过去的许多复制计划都变成了灾难现场。比如,2008年研究者曾试图复制100项心理学实验,但是其中只有39%的实验能被复制。心理学领域的知名期刊《心理科学观点》(Perspectives on Psychological Science )曾经发表了“注册复制计划”(Registered Replication Reports,RRR),号召全世界的实验室复制几项实验,然后把数据整合分析。结果,4项实验中已经完成的3项均告失败。

2015年4月,复制实验正式启动。

Wagenmakers 的团队招募了来自8个国家、17个实验室的科学家。每个实验室都复制了 Strack 的原始程序,实验参与总人数达到2000人。研究方法也有一些更新:参与者通过观看预录制的视频获得实验指导语,而且实验全程都会被拍摄记录下来,看看他们到底有没有用正确的面部表情衔笔。

实验数据采集,数据分析,报告撰写和编辑又花了16个月的时间。结果终于在今年8月18日出炉了。

情况并不妙。

在一半的参与实验室中(17个中的9个),摆出微笑表情的参与者对卡通搞笑程度的平均评分略高,比摆出皱眉表情的高0.1到0.2分(总分10分)左右。但是在 Strack 的原始实验中,微笑者和皱眉者的分数差异达0.82分。在其他实验室的数据中,微笑的效应看起来是相反的:微笑的参与者比皱眉者的评分低0.1到0.2分。当 Wagenmakers 把所有数据综合起来以后,微笑的效应消失了。微笑者和皱眉者的平均评分的差异是0.03分,这可能是噪音或随机性导致的。

“我真希望这项研究能被复制出来,” Wagenmakers 表示,“不幸的是,结果并非如此。”

Strack 并不后悔让RRR 来重复自己的研究,但也没有把复制研究的结果太当一回事,“我看不出我们从这个研究中能得到什么有用的信息。”

两年前,当这项复制研究计划在实施的过程中,Strack 和另一位社会心理学家 Wolfgang Stroebe 写了一篇批判该复制计划的论文,名为“所谓的危机和完美复制的错觉”(The Alleged Crisis and the Illusion of Exact Replication)。他们在文中提出,类似于 RRR 一类的项目实际上反映的是一种“认识论误区”,因为完美地复制一项古老的研究是不可能的,人会变,时间会变,文化也会变。任何社会心理学家不会两次踏进同一条河流。他们说,即使再做一次同样的实验,消极的结果也没什么意义,因为它并不能解释为什么复制研究没有成功。

所以,当 Strack 重新审视这项复制研究的结果时,他并不认为自己的实验失败了,而是觉得另有隐情。毕竟,有9个实验室的数据是在正确的方向上。而其他8个实验室得到了相反方向的数据。他认为,为什么非要把所有数据平均从而算出效应为零呢?为什么就不能弄明白,两批数据之间的本质差异是什么?或许一半的实验室无法得到微笑效应是有原因的。

Strack 对复制项目的评论和复制研究报告一同发表出来。Strack 的评论中挑出了一些复制研究的问题。比如,研究排除了600名参与者的数据,这差不多是总参与者人数的四分之一。根据 RRR 的说法,这些人被排除的原因是因为他们衔笔的姿势不正确,或打分太飘。Strack 认为另有原因,很多受试者是心理学的学生,或者已经猜测到实验目的。毕竟,这个实验在该领域太有名了。

另外他还指出,80年代的卡通片素材未必能“在当代本科生中引发相似的心理效应”,他在复制项目初期就和 Wagenmakers 提到过这个问题,但是对方没有理睬。不过,RRR 团队在实验开始前曾经让另外120名阿姆斯特丹大学的学生评价过该卡通片的搞笑程度,发现评分与过去基本相同。

Strack 接着提出了摄像头的问题,因为它们会让参与者开始关注自身的行为,并压抑自己的情绪。最后,他还对复制研究者的偏见存在疑问,似乎他们是有意让结果对其不利,因为样本最大的那个实验得到的结果是积极的。

没有调查就没有发言权,让我们回溯到1988年,看看 Strack 最初的论文。该论文包含两次研究,第一次研究得出0.82的差距之后,两人甚至不敢告诉当时的老板。之后他们又优化细节,进行了第二次实验。换句话说,这个实验 Strack 自己是重复过的。

在 Strack 的第二版实验中,他希望把参与者的客观评价和主观情绪感受分离开来。参与者要回答两个问题:第一 ,这个卡通的搞笑程度如何;第二,他们感到多有趣?第一个问题中皱眉者对卡通的评分反而比另一组高出0.17分。但是第二个问题的结果似乎复制出了此前的研究结果。微笑者感受到的有趣程度的分数比皱眉者高出整整1分。

那么, Strack 本人对此怎么看呢?以论文中的叙述看来,他认为重复是成功的。他说,他预测第二个问题-“这个卡通让你感到多有趣?”会不同于参与者对第一个问题的回答,而且事实的确不出他们所料。

但是事后看来,这个后见之明——问题问法的改变本身就是一个值得警惕的现象。心理学的基础证据至少是有一些裂缝的。这个实验的存在本身就证明最初的结论并不稳定。为什么其他人没有注意到呢?

这项复制研究的失败有多糟糕呢?这也许取决于你看这个新闻时的表情了。如果你心情不错——因为你嘴里衔着一支笔,嘴巴咧到耳朵边上,那么你可能并不会觉得这是个大问题。说不定你会同意 Strack 的观点,认为卡通片,摄像头或是样本本身有问题。但不论如何,有一个事实无法否认:衔笔实验的结论是无效的。

或许你的看法更加悲观。或许 Strack 的原始论文有问题,或许衔笔这个方法本身就存在重大缺陷,甚至每个用这个方法的实验都有问题。现在你的额头开始皱起来了:如果问题发生在更深的层次,怎么办?如果名气如此响亮,影响力如此巨大的衔笔研究都无法复制,那么其他不出名的研究会怎样?或许表情对情绪有直接作用的观点本身就是错误的?或许达尔文从一开始就错了!

如果面部反馈领域也受到“文件夹效应”的影响那怎么办?那些研究结果和 Strack 一致的可以被发表,而不一致的研究就只能被束之高阁了。如果情况真的如此,那么 Strack 引用的后续研究都将是虚假的。

实际上,衔笔复制实验的失败并不令人吃惊,因为几乎每个大型心理学复制计划都以失败告终。关于具身认知(embodied cognition)的其他重磅理论,比如权利姿势(指双手叉腰会让人感到更有自信),还有麦克白夫人效应(指感到愧疚时对“清洁”相关的概念会更加敏感)的复制研究都没有得到支持性的结果。

心理学是不是岌岌可危了?那么认知神经科学呢?其他科学领域呢?

这就是可复制性危机的核心。

问题在于,做一个批判主义的心理学家没什么好处。如果你想要让自己的研究出名,获得媒体和同行的瞩目,你就得搞个大新闻,弄出一点戏剧性的,令人意想不到的数据出来。

Wagenmakers 认为问题应部分归咎于科学期刊编辑,他们对证据坚实且渐进的科学研究并不那么热衷。他认为媒体也难辞其咎。媒体喜欢宣传不那么靠谱,但却吸引眼球的研究。我们自己呢?同样容易受到荒谬的研究结果的吸引(比如有一个研究称因飓风丧生的受害者多带有女性的名字)。这些因素给研究者带来了错误的动机,让研究者以为,证据最弱的研究反而最重要。

Wagenmakers 说,要向前看。期刊正在改变政策,透明度正在增加,科研经费资助机构也开始资助复制研究。心理学家们意识到了自身的问题(p值操纵,发表偏倚),这是件好事。不管怎么说,不破不立,不塞不流,不止不行。

来源 Slate / Daniel Engber

编译 徐寒易 张士超

责任编辑:王真_NT5228
内容加载中