你以为的人性实验,其实是一场“剧本杀”
社会心理学的实验怎么了?
存在如此问题的实验,却提供了比较正确的结论,这是“歪打正着”吗?我们为此推出专题《“歪打正着”的实验》,希望通过对这三场经典实验的回顾,反思社会科学实验法的某些困境。
其中,本篇回顾的是“罗森汉实验”和“斯坦福监狱实验”。
1971年,津巴多(右一)和部分研究团队成员。图片来自津巴多所创网站“prisonexp”。
“罗森汉实验”揭示了美国二战后精神诊断体系严重缺乏可靠性——医护人员无法识破伪装的正常人,而一个人只要被贴上“精神病”的标签,其正常行为也会被当作病症;“斯坦福监狱实验”则发现了在强大的情境和角色作用下,一个人可能迅速内化施虐或服从的行为,“好人在此过程中也会变为“恶魔”(被概括为“路西法效应”)。“罗森汉实验”和“斯坦福监狱实验”早在发表不久后都曾遭受批评,不过批评都基于研究方法或研究伦理,比如“罗森汉实验”被指过于粗糙,算不上完整的研究,“斯坦福监狱实验”则因为伦理问题一直陷于争议之中。与这些批评不同,这里要说的是近年来才出现的,针对实验的过程和材料的真实性质疑。
“如果人们要说这是一个骗局,那就由他们去说吧,我也不再打算为之辩解了,其实它(实验)的留存时间就是一种辩护。”
这是津巴多(Philip Zimbardo,1933年3月23日-2024年10月14日)生前的最后一次回应。他是“斯坦福监狱实验”策划者,也是影响最大的社会心理学家之一。多年来,多起经典实验被质疑,他是在被质疑后唯一站出来全面回应的研究者。“罗森汉实验”被质疑时,罗森汉(David Rosenhan,1929年11月22日-2012年2月6日)已经去世,我们无法看到他的回应。
津巴多认为,批评并没有提供实质性证据,不能推翻他的结论。他说实验的“留存时间就是一种辩护”,换言之,只要实验留存于世,就足以反驳对实验的质疑。这个结束语看似寻常,实则耐人寻味。
这得从社会科学实验(以下简称“实验”)的特征说起。
本文内容出自新京报·书评周刊4月3日专题《“歪打正着”的实验》B02-03版。
实验的两个身体
虽然人们赋予了知识许多荣耀,可很多时候,接受知识实在是一个痛苦的过程。这种痛苦可能源于知识的乏味,讲者照本宣科,听者却只管打瞌睡;这种痛苦也可能源于知识对我们本身所持偏见的冲击与否认,让人难以承受,只能骂它一派胡言,什么也不是。
电视剧《围城》(1990)剧照。
当然,有一些知识唾手可得,哪怕我们未必知道它是怎样被生产出来的。
以“效应”结尾的概念是一个例子,我们在谈论观点时只要捎上“马太效应”“破窗效应”或“达克效应”,就好像已经透过现象,在看本质。另一个例子是实验。比如“霍桑实验”,它揭示了人一旦意识到自己被观察,行为就会改变;再比如“从众实验”,它观察了群体行为与态度对个体施加的压力。我们且叫这种有统一后缀的知识为“后缀体”。其特征是,在概念构造上就给人一种笃定的气质:它不是某个偶然的、局部的发现,而是对人或社会某方面规律的普遍概括,是一种法则。
什么是实验或实验研究法?实验,即研究者通过主动操纵自变量、控制无关变量,并在受控环境中观察自变量对因变量的因果效应,从而检验理论假设的一种研究方法。
这个定义使社会科学获得了苦苦追求的,有限的科学性。由于社会科学不可能成功效仿自然科学,做不了一场完全科学的实验,于是退而求其次,有的在实验室进行,有的在现实世界开展,有的引入问卷调查方法,还有的混杂着干预研究。其中被认为最接近科学的,是在实验室进行的实验。研究者征集若干志愿者,将他们请进特定的场所参与测试,编入实验组和对照组,有意识地改变一个变量,观察另一个变量的变化,以此推断“什么导致了什么”。由于因果关系是科学的基础,在研究者那里,实验也就获得了它的第一个身体,这是一个理性的、客观的、绝对的身体。
也由此,我们作为接受者会认为实验结论是可靠的、正确的。只不过这不是我们接受实验的全部理由。
电视剧《非常人力资源》(2020)剧照。
我们都听过职场上的年龄歧视问题,现在,假设有以下研究摆在跟前:
(1)根据检索关键词统计发现,过去一年社交媒体上关于年龄歧视的帖子比前一年多了5%;
(2)从某招聘网站的招聘公告里统计出10%明确提到期望年龄;
(3)通过上街发问卷,调查发现某开发区“25岁-34岁”和“35岁以上”两个人群的求职反馈有显著差异,p=0.03;
(4)根据劳动力成本理论和当前劳动力市场供求关系可推断,科技型企业普遍会将年龄视为一个关键考量;
(5)虚构1000份求职简历,向100家招聘不限年龄的公司发送邮件发现,在工作经历、学历、性别和肖像照片等条件均相同情况下,28岁、33岁和39岁三个年龄组得到的面试率分别为13%、12%和5%。
举这个小例,不是要说哪个方法更可靠,或者效度更高(它们之间确实存在差异),而是说,实验这种方法即便使用了高度抽象的数学和统计,当它被讲述时,都像或者说都可以变为一个故事——有些雇主把对年龄的偏好藏在招聘启事背后,最终经不起测试,被悄悄揭穿。
投递实验性简历是最简单的一种实验研究,在过去几十年,经济学和社会学经常使用此种方法。它有人物,虽然形象极度模糊;它有一些情节,但不多;它因为缺乏戏剧性冲突,不够精彩。一方面,受制于情节、语言和传播媒介,此种简历实验发表后,除了研究者和期刊编辑,可能根本没几个人读。另一方面,要是有人读了,当未来的人谈起我们当下的企业用人标准时,这个人可能早已忘记了数据,却依稀记得当年曾有一些雇主,在简历测试中暴露了对年龄的真实立场。他于是轻轻一笑,感慨那样的职场生态,总算过去了。
这就是实验的第二个身体,它是叙事性的,是可以被感知的。在我们接受它、讲述它和回忆它的过程中,它一直若隐若现,最终因为我们忘不掉它而成形:它成为一个故事。这是社会科学实验的一个特征,无论其研究结论是否正确,是否在“情理之中”。当“斯坦福监狱实验”被质疑存在操控和表演,津巴多(Philip Zimbardo)回应:“如果人们要说这是一个骗局,那就由他们去说吧,我也不再打算为之辩解了,其实它(实验)的留存时间就是一种辩护。”他知道,人们已经不可能忘记这个实验。
接下来,让我们走进情节远比简历实验复杂的“罗森汉实验”和“斯坦福监狱实验”。
精神病院里的“正常人”,
查无此人