登录

科学网—粗糙的假,精密的筛:顶端造假为何越来越潦草?


速读:造假是先允许自己被自己欺骗。 社会心理学早有提醒:把本应由情境和结构解释的行为,归结为某个人的品性,本身就是一种系统性的认知偏差,即所谓"基本归因错误"(fundamentalattributionerror)。 它必须依附一个明确、可被博弈的标准才能运转; 按这个标准,"卷"恰恰是刻意练习的退化版本:它保留了高强度、长时间,却抽掉了"信号",因为它瞄准的不是真实理解或真实能力,而是一个外部的、可量化、可被博弈的指标(考分、论文数、竞赛奖项、各类"帽子")。
粗糙的假,精密的筛:顶端造假为何越来越潦草? 精选

已有 312 次阅读

2026-6-1 12:53

| 个人分类: 把问科研 | 系统分类: 观点评述

引子:同一条流水线的两端

把最近的两件事放在一起看,会发现一个被忽略的结构。

一端,是一位在校学生在竞赛获奖后向同伴瞒报奖金金额,被追问时改口称仅到账一小部分,并使用AI生成工具伪造了一张收款记录,事后经所在学院核实并予以通报处分。另一端,是经独立核查者揭出的若干顶刊论文:两组各十三个数据中有八个完全相同,且小数点后亦有三位一致;两百余个数据的末位整齐划一地全为0或5;同一只实验小鼠的"死亡"图像被重复使用了两次,未见任何重新拍摄的痕迹。

一个是初出茅庐的学生,一个是身居高位的学者,看似风马牛不相及。但本文想论证:他们是同一条筛选流水线的两端,而这条流水线的运转逻辑,可以被相当清楚地拆解出来。

先把本文的视角钉死: 这篇文章悬置对个体的道德评判。 社会心理学早有提醒:把本应由情境和结构解释的行为,归结为某个人的品性,本身就是一种系统性的认知偏差,即所谓"基本归因错误"(fundamental attribution error)。更何况这里真正在发生的,并不是"好人"与"坏人"的分野,而是一种结构性的价值两难:个体身上若干各自都正当的取向(对家人的责任与对生存的本能,对真实的坚持与对规范的忠诚),被同一套约束逼成了相互排斥的选项,这正是社会学家默顿所说的结构性"紧张"(strain)。当一套结构把两种各自成立的取向制造成一道非此即彼的单选题,那么落在某个人身上的"选择",与其说暴露了他的禀性,不如说暴露了那道题本身。所以本文不在个体的善恶上停留,只把镜头对准出题的机制:造假为什么会越来越潦草。这不是和稀泥;恰恰相反,只有把归因从个人移开、对准结构,才谈得上真正解决问题;在个体善恶上纠缠,反而会让真正的病根藏起来。

那个反常的问题是: 为什么爬到顶端的人,造假反而造得如此潦草? 直觉会归因于"个别人道德滑坡"。但当潦草成为反复出现的模式,它就不再是偶然失手,而更像一台机器在稳定地输出残次品。本文要给出的答案是:这种潦草不是意外,而是"卷"这一筛选机制的必然产物:它会系统性地选上那种造假时没有负担、下手大胆的人,同时把那种既能做出原创、也能一眼识破造假的人挤出局。

一、卷是退化形态的"刻意练习"

要讲清机制,先要把"卷"这个词的内核说准。

心理学家安德斯·艾利克森(Anders Ericsson)1993年对柏林音乐学院小提琴手的研究奠定了"刻意练习"理论:顶尖高手与普通演奏者最显著的差别,是高质量练习的累积。这一发现后来被畅销书包装成"一万小时定律",以为时间堆够就能成专家。但艾利克森本人反复澄清,这是误读:真正起作用的不是练了多久,而是 练的是什么 。同样练一首曲子,把它从头到尾弹上一千遍,你收获的只是熟悉感;只有专挑自己一弹就乱的那几个小节,降速、感知错误、每次只改一个点,你才换得来控制力。前者再勤奋、时间再长,也只是低水平的重复。真正的刻意练习有苛刻的条件:成熟的训练体系与导师、高分辨率的目标、即时的反馈、始终待在"差一点会、但还不会"的学习区。它本质上是一种误差压缩技术。

按这个标准, "卷"恰恰是刻意练习的退化版本 :它保留了高强度、长时间,却抽掉了"信号",因为它瞄准的不是真实理解或真实能力,而是一个外部的、可量化、可被博弈的指标(考分、论文数、竞赛奖项、各类"帽子")。

这里可以借用经济学里的 古德哈特定律(Goodhart's Law) :当一个度量变成目标,它就不再是好的度量。论文数本是科研产出的代理指标,一旦它本身成了追逐对象,人们优化的就是"指标"而非"科研"。卷到极致,最经济的优化方式不是把研究做好,而是把数据编好,并且用最省力的方式编。 潦草的造假,正是"优化指标"被推到尽头时的理性结果。 这一步纯粹是机制使然,与编造者的品性无关:换上任何人,只要约束相同,最优解都指向同一个方向。

二、卷只在前端有效,到了前沿便失灵

更关键的一点是: 卷在结构上只能作用于前端,到不了前沿。

这不是修辞,而是有数据的。刻意练习对"从新手到合格"效果极为显著,但越往高处解释力越弱。一项被广泛引用的元分析(Macnamara 等,2014)显示:刻意练习的总量在棋类只能解释约28%的表现差异,音乐约21%,体育约18%,教育约4%,而专业性的职业工作不足1%。另一项针对体育的元分析(2016)更具体:对普通运动员,刻意练习能解释约18%的差异;但若只看精英运动员,这一因素的重要性只剩约1%。

为什么?因为刻意练习在"规则死板、不确定性低、反馈即时"的领域(钢琴、国际象棋)解释力高;而在"环境复杂、不确定性高、评价模糊、反馈滞后"的领域(商业决策、创意写作,以及真正的原创研究),你常常根本不知道自己错在哪,也就无从即时修正;刻意练习在这里只是入场券,决定胜负的是别的东西。

"卷"继承了刻意练习的全部前端属性,并把它推向极端。它必须依附一个明确、可被博弈的标准才能运转; 而明确、可被博弈的标准只存在于前端。 真正的前沿没有现成的评分表可供誊抄,因为前沿的定义就是"还没有标准答案的地方"。所以卷可以把人推到"合格专家",却推不到"原创高手":到了那一层,它要优化的那个指标根本不存在。

这就解释了一个普遍的错觉:人人都觉得"前期卷是管用的",确实管用,因为前端正是它的有效区。但由此推断"一路卷下去就能登顶",是把局部经验错误地外推到了全局。

三、桥梁变量:敏感度

那么,决定前沿差异的"别的东西"是什么?相当一部分,是天赋。而天赋并非玄学,可以被工程化地拆解。

综合这一系列研究,可以给天赋下一个相对清晰、也更可操作的定义: 天赋就是天生的敏感度和可塑性。 它并非一团说不清的灵气,而是几样可被拆解、甚至有遗传学证据支撑(Plomin 等人对特定认知能力的研究)的参数:

其一, 传感器更细 :对信息有更高的分辨率,能看见旁人看不见的细微差异。在认知领域,这意味着对"模式、结构、异常点"格外敏感。这一条有相当高的遗传成分(也可后天培养,但起点不同)。

其二, 神经网络更新更快 :同样被指出一处错误,有人只感到受伤,有人却能立即在头脑中重放、定位、拆解、重组。这与工作记忆容量等大脑硬件条件相关。

其三, 奖励函数更敏感 :同一串练习,对有的人信号更密集、回报更快,于是不觉得无聊反而上瘾。兴趣本身也是一种天赋。

请特别留意前两条。 "对异常点格外敏感"加上"能瞬间定位、拆解一个错误",几乎就是识破造假所需要的全部能力 :看出小数末位不像随机数生成器的产物、看出两组数据撞了八个、看出两只小鼠死法雷同,靠的正是这种对反常的高分辨率。

而同一种敏感度,也正是 原创 的源头:能看见别人看不见的结构与反常,才能提出别人提不出的问题。

于是我们得到一个本文的核心命题: 能识假与能原创,本是同一副头脑的两面。 这个命题接下来会反复起作用。

而这两面之所以同源,不只是因为"用的是同一种敏感度",更因为它们指向同一个动作: 朝向内部的、近乎苛刻的自我审视。 几乎所有真正做出原创的人,都是经过大量自我审视的人;而且这种审视并非被规训出来的守则,而是高分辨率的头脑对自己的输出同样高分辨率,因而自然、甚至忍不住要发生的本能。它中西皆然:东方有曾子的"吾日三省吾身",把反躬自问当作一种内在的日常;西方则有费曼在1974年加州理工毕业演讲中的那句名言:科学诚信的第一原则是你绝不能欺骗自己,而你恰恰是最容易被自己欺骗的那个人;只有先做到不欺骗自己,不欺骗别人才变得容易。

请注意这个次序,它把"审己"放在了"审人"之前。真正能查出别人数据破绽的人,首先是那个对自己的每一个结论都过不去、反复盘问"我是不是骗了自己"的人;而原创之所以可能,也正因为这种人不肯接受一个连自己都说服不了的答案,才会一路逼问到别人没去过的地方。换句话说,鉴伪与原创不是两种才能的巧合并存,而是同一种"不肯自欺"的禀性在两个方向上的投射:对内,它逼着人做出真东西;对外,它让人一眼识破他人的自欺。 造假,恰恰是这种自我审视的反面:它的前提,是先允许自己被自己欺骗。 这也从更深一层预示了后文将反复出现的代价:一套把高敏感者筛掉的机制,必然同时流失原创力与鉴伪力,因为被筛掉的,是同一种禀性。

四、"累"是怎么淘汰人的

现在进入这台机器最关键的环节:在以"产出指标"论英雄的赛道上,"累"是如何系统性地筛掉一类人的。

把三件事并排放好:

做真东西,本来就很难。 真做出原创,是世上最难的事之一;前面已经说过,到了前沿,努力的边际回报急剧衰减。

造假,其实也不轻松。 你要圆谎、要让数据彼此自洽、要时时提防被人核对、戳穿。

而越是对真假敏感、越有"洁癖"的人,造起假来就越累。 《生活大爆炸》里的谢尔顿是个极好的例子。他不过是顺着人情,替别人圆一句"某某当时不在我家"的小谎,却觉得这谎根本立不住,于是花钱雇了一个流浪汉上门配合演戏,非要造出一个滴水不漏的闭环不可。在他这种人眼里,假的东西哪怕只差一点,都像扎在身上,绕不过去。

这就解开了一个表面的矛盾:研究说天赋高的人觉得真正的刻意练习"上瘾",可现实里高敏感度的人却往往受不了"卷"。矛盾是表面的: 真练习是密集的信号,所以让他上瘾;卷是抽空了意义的噪声,所以让他过敏。 同一副高分辨率的传感器,对真信号的贪婪和对假信号的排斥,本就是一体两面。

于是同样一件造假的事,落在两种人身上是两种结果:

敏感的人:做得心力交瘁、内心煎熬,越想造得逼真,所付出的心理代价越高,常常中途即告放弃;

不敏感的人:下手却很大胆,他不太纠结,也不太担心,随手就把一个数字说少、让一只小鼠死两次。

把"做真"和"造假"两条路摆在一起,对敏感的人来说, 哪条都格外累 。真东西做不快,假东西又造得痛苦。于是在这条只看产出速度的赛道上,他们节节落后,慢慢被磨出局。

这里要补足一个常被忽略的维度:敏感度低,钝的不只是"良心",还有 风险计算 。需要强调,本文绝不是说造假情有可原(抛开道德层面,造假本就应当被严惩,否则学术系统乃至社会秩序都会失序,而现实中造假一旦暴露,代价也确实极其沉重)。正因如此,一个值得追问的现象是:为什么有人敢把最粗糙的假,摆到最显眼的位置,发到 Nature 这类被全世界盯着的顶刊上?答案仍然落在敏感度上。高敏感者即便昧心去造,也能清楚地算出"越高的平台=越密的审视=越高的暴露概率"这笔账,于是要么不敢,要么造得极其费力(前述谢尔顿为圆一句小谎而层层加码,正是这种算计的极端形态)。低敏感者则连这笔账都算得迟钝:他既感受不到造假的不适,也估不准被发现的风险,于是把最省力的伪造,恰好放到了风险最高的地方。 "造假潦草"与"造假被抓",因此是同一种钝感的一体两面。

需要再次强调视角:这里没有"谁更高尚"的判断。敏感是一种神经特质,不是美德勋章;半途放弃也不是懦弱。我们只是在描述:在某种约束下,某种特质会让一个人付出更高的成本,从而更容易被淘汰。

五、逆向选择:系统在反着筛人

把以上几块拼起来,结论几乎是自动浮现的。

一套以"卷"为入场闸门的筛选系统,其选拔标准是"在可博弈指标上的高强度产出"。这个标准对不同的人是 反向 起作用的:

对敏感度低的人,卷可以忍受甚至顺手,他们不被无意义的重复折磨,对造假不甚不安,也看不出粗糙数据的破绽。系统把他们一路礼送上去。

对敏感度高的人,卷难以忍受,做真太慢,伪造的心理成本又过高,两条路径都通向更高的耗损。系统于是将他们逐一筛除。

这就是经济学意义上的 逆向选择(adverse selection) :选拔标准与你真正想要的特质负相关。把"劣币驱逐良币"搬到人身上,就是**"劣才驱逐良才"**。

到这一步,顶层造假的潦草就不再需要"道德滑坡"来解释了。 它是筛选函数的预测输出。 系统持续地以"低敏感"替换"高敏感",那么被选上来的人,本就最难察觉自己那组数据有多失真;课题组负责人甚至未必知情:一篇论文作者一长串,学生只盼尽早毕业,彼此之间也未必有深到会替对方守住底线的牵连。潦草不是bug,是这套设计正常运转的结果。

这里还藏着一个最具讽刺意味的推论。回到第三节的核心命题:能识假与能原创是同一副头脑的两面。 那么,系统在淘汰高敏感者的同时,也就淘汰了自己最好的把关人。 它亲手筛走了唯一能在内部察觉造假的那种神经特质。第一道防线(专家、期刊、学术委员会)之所以拦不住肉眼可见的粗糙造假,正是因为把关人和造假者出自同一条逆向选择的流水线。

六、监督的外溢,与最沉重的那种代价

既然能识破造假的人都被筛到了系统之外,那么监督就只能从外部发生,靠独立的打假人、靠公众。今天活跃的"学术侦探",很大程度上就是这批高敏感度的出局者:他们当年卷不上去,不是看不懂,而是受不了;如今"我上不去,又不是看不明白,那我就把问题揭出来"。监督机制被迫外溢,本身就是内部防线失灵的镜像。

而"出局"还不是这套机制索取的最重的代价。

这些年我们也见过这样的事:一个985高校王牌专业、本已拿到直博资格的学生,在做毕业论文时自己发现仿真结果有明显错误,过不了自己那一关,于是推翻重来。可在"按时答辩、按时毕业"的硬约束下,这一耽误,便意味着保研直博的资格被取消。最终,他结束了自己的生命。

请注意这中间的因果: 恰恰是他的认真,主动发现错误、拒绝糊弄,把他推到了悬崖边。 换成一个不那么敏感、随手糊弄过去的人,反而能顺利毕业、保住资格。

这正是"反着筛人"最值得注意的地方: 同一种敏感度,在奖励它的规则下是天赋,在惩罚它的规则下就成了致命的负累。 特质本身并无优劣,起作用的,是它与当前这套筛选规则的匹配方向;任何规则都只是对某一组特质的偏好,世上并不存在一劳永逸、对所有特质都恰好友好的完美机制。它也最清楚地暴露出,用道德去评判个体在这里为何失灵:对真实负责到底是一种取向,对家庭与自身的存续负责也是一种取向,两者本可并存,却被这套结构逼成了你死我活的单选题,逼到一个人最可贵的特质反而成了致命的处境。面对这样被制造出来的两难,追问"谁更高尚"是没有意义的;该被审视的,是那个出题的机制。

七、为什么偏偏是现在集中爆发

机制的存在解释了"为什么会有",但还要解释"为什么是现在"。这一节给出时间维度,同样只谈结构、不涉善恶。

先澄清一个容易被误读的前提:这里要谈的,不是"日子过不下去了"。恰恰相反,物质生活在持续变好,生活必需品也越来越丰富,绝对水平始终在上升。真正出问题的,不是"蛋糕变小",而是几个量之间的 增速错配 。

可以把它拆成三个速度。其一,生活必需品的供给,增长很快、绝对水平在涨,这一层不构成问题。其二,人们真正争夺的"好位置"(好职位、教职、稳定的编制这一类),它的增长,却远远跟不上 追逐它的人数 :大学、硕士、博士一路扩招扩容,把越来越多的人导向同一批稀缺的位置,分母猛涨,分子几乎不动。所以"卷"的加剧,并不是因为饼变小了,而是因为抢同一块饼的人,正以更高的加速度涌进来。其三,更关键的是,这条赛道的回报本身正在贬值:当 AI 开始替代大量原本要靠这些学历与位置去兑现的工作,"读到博士、挤进教职"这条路径的性价比骤然走低、风险骤然升高:投入仍是二十年的全力以赴,产出却不再担保当年那种回报。

这里要警惕一种"何不食肉糜"式的错觉:把"必需品越来越丰富"直接当成"机会越来越充裕"。但真正稀缺的从来不是肉糜,而是那几个好位置;丰裕的物质,恰恰掩盖了机会通道的拥挤与贬值。

把这三层叠起来,"为什么是现在"就清楚了:不是经济崩了、人变坏了,而是那条"靠卷换好位置"的老路,回报在缩水、风险在上升、争夺者却在加速涌入。当一条赛道从"多劳多得"逼近"零和博弈",原本被增长红利所掩盖的造假,便骤然变得既扎眼、又"不划算再被容忍":不是造假忽然变多了,而是盯着它的人多了、能容错的余地小了。所以打假在某个时点集中涌现,靠的不是道德水位的突然抬升,而是这套博弈结构本身的变化。把这一层加进来,整台机器就有了完整的动力学:既有"为什么会这样"的结构,也有"为什么偏偏是现在"的触发。

八、局部最优陷阱:为什么越信卷,越做不出原创

最后回到个体层面,讲清"卷"为什么是一笔结构性的坏投资。除了前端有效、前沿失灵的低性价比,它还有两层更深的代价。

第一是 精力的排他性 。人的精力有限。一旦把全部精力压在刷指标上,就没有余力去做那些没有现成评分表、却真正可能产生原创的探索。相信卷与做出不卷,在精力账本上是互斥的。

第二是 局部最优陷阱 。2025年《科学》上的一篇重量级综述(Güllich 等)发现:少年时表现得像神童的孩子,与成年后真正的世界级高手,有将近九成不是同一批人。那些很早就靠高强度训练取得辉煌的孩子,长大后往往泯然众人;而真正的大师,小时候反而不显山露水。原因在于:通用天赋强的人本可以在很多方向上都做得好,但 过早锁定单一赛道,往往只能找到一个局部最优 。真正的高手早期会广泛探索,不急于专业化,先搞清楚自己最适合什么,再投入。

"卷"恰恰是被迫的、过早的专业化,而且是 亦步亦趋地沿着别人已经踩好的轨道 去优化。沿着既定轨道把别人做过的事做得更熟练,按定义就到不了别人没去过的地方。这是"小时了了、大未必佳"的科学版解释,也是为什么 越是笃信卷,越只能跟在别人后面,越不可能长出自己的东西。

把第二节和这一节合起来看,会得到一个更冷的结论:到了前沿,刻意练习只能解释约1%的差距,其余靠的是那种高敏感度的天赋;而前面几节说明,整套筛选机制恰恰在源头上排斥这种神经特质。

这其实正面回答了那个著名的"钱学森之问":为什么我们的学校总是培养不出杰出的、原创的人才?沿着本文的机制,答案不必再诉诸文化或天命:问题不在"培养",而在"筛选"。第三节已经说明,原创的内核是那种不肯自欺、自发自省的禀性;而这种禀性的持有者,恰恰最受不了无意义的"卷",也最容易在"按指标论英雄"的赛道上吃亏出局。于是这套机制在系统地做一件自相矛盾的事:它一边呼唤原创,一边在入口处就筛掉了原创所必需的那种人。 所以不是我们缺少能做原创的苗子,而是这台筛选机器的偏好,恰好与原创的禀性相反:它在奖励原创的对立面。 这正与本文反复出现的主线吻合:原创的匮乏,与造假的粗糙,本是同一次筛选的一体两面。

九、向童年追溯:优绩主义,与一台从未停机的分拣机

到这里还可以再追问一层:这台"以可博弈指标论英雄"的机器,是读研、评职称时才开机的吗?不是。它只是一套更庞大的分拣系统的末端,这套系统的名字,叫优绩主义(meritocracy)。

"meritocracy"一词最早出自英国社会学家迈克尔·扬(Michael Young)1958年的一部讽刺作品,本是个警告,后来却被普遍当成了褒义的理想。晚近的批评者(桑德尔《精英的傲慢》、马科维茨《精英陷阱》)反复指出:优绩主义最深的腐蚀,不在于它不够公平,而在于它把人的整个成长历程,从很小的年纪起,就改造成一场永不停歇的排名锦标赛。一个孩子在六岁就被教会:要紧的不是真的懂了什么,而是分数与名次。这正是古德哈特定律的童年版本:当"排名"从一开始就是目标,那么对真实信号的高分辨率敏感,反而成了拖慢刷分的累赘,会被这套训练悄悄磨平,甚至惩罚掉。

换句话说,那个走到顶端、连随机数生成器都未加使用的人,并不是某一天突然学会了刷指标,而是被这台机制优化了整整二十年,才被塑造成今日的样子。卷不是某个阶段的失常,而是优绩主义贯穿一生的常态;学术造假的潦草,不过是这条二十年长链最后一节的成色。

而社会学对这台机器的产物,早有一个近乎预言式的框架。罗伯特·默顿(Robert Merton)的"紧张理论"指出:当一个社会把单一的成功目标(升学、晋升、获取各类"人才帽子")高高举起,却堵死了大多数人正当达成它的通道,可预期的结果不是安分,而是几种"适应方式":其一是"革新",即改用不正当的手段去够那个目标,这正对应造假;其二是"退缩",即个体从整套游戏中整体性地退出乃至坍塌,表现为耗竭、抑郁、自毁。前面说到的那位推翻自己论文、最终一跃而下的学生,是把这种紧张默默地转向了内;而另一名在课堂上对着老师连喊三声"杀杀杀"、随即被校方定性为"有心理疾病"的学生,则是同一种崩溃以最响亮的方式爆了出来:它看似指向外部,内核却仍是冲着"那个一直被逼着假装正常的自己"。

这里需要补足一个本土的维度。中国语境下的优绩主义,并不是西方那套竞争性选拔的简单移植;它接续的是"学而优则仕"这一延续千年的传统:以一套统一的考核,把"优"直接兑换成向上流动乃至进入治理体系的资格。科举早已废止,但"以单一阶梯定终身"的深层结构被继承了下来,并在当下被再度强化:在增长放缓、风险上升的环境里,"考公""考编"对"稳定"的集体追逐,把本就狭窄的成功通道收得更窄,几乎窄成了唯一被广泛认可的人生路径。

正是这种"目标高度统一、通道却被严重收窄"的格局,构成了默顿所说"紧张"的本土加强版。当一个社会把成功定义得如此单一,又让正当达成它的名额如此稀缺,那么沿着规则之外的捷径去够取目标,就不再是个别人的品行问题,而是结构压力下相当可预期的"理性"反应。所谓的"人性弱点"(避难就易、走捷径、把代价转嫁给制度),在宽松多元的机会结构里未必显形,却会在这种高度内卷、赢者通吃的氛围里被系统性地激活、放大,并最终筛成主流。换言之,造假不是优绩主义的意外副产品,而是它在通道足够窄时几乎注定要长出的东西。

把这些放在一起看:顶端的造假、把自己逼到绝境的认真者、课堂上情绪失控的学生,它们看似风马牛不相及,其实是同一种结构性紧张的不同出口。这一代人不只是被这台机器"筛",更是被它"磨"。需要说清的是,用机制去解释,从不是要把任何当事人浪漫化成反抗的英雄,也不是要把他妖魔化成危险的异类:这两种简化都跳过了机器本身。当紧张在极少数情形下真的转向外部、伤及无辜时,行为的错也不因有社会成因而减损一分;解释是为了诊断,不是为了赦免。但一台把成功通道收得如此之窄、又持续地把整整一代人优化成"只认指标"的机制,本身才是最应被纳入审视的对象。它,才是那道单选题真正的出题人。

十、为什么没有人在源头拦住它:一台开环运行的机器

至此还剩一个最关键的疑问:既然这套机制的危害如此清晰,为什么没有人在它的起点处把它拦下?

答案不在"谁失职",而在一个"信息—时间"的结构性困境:从一个孩子被按上单一跑道,到他长成顶端那位连随机数生成器都未加使用的学者,或中途坍塌的学生,中间隔着二三十年。因(早年的优绩主义训练)与果(后端的造假或崩溃)之间,横亘着一条没有任何一个责任主体能够完整看见的时间线。

前文提到,刻意练习之所以有效,靠的是"错误—即时反馈—修正"这条闭合回路。而这套教育与选拔机制恰恰相反:它的反馈回路被时间拉断了,整台机器是在"开环"状态下运行的:错误发生在起点,后果显现在终点,中间却没有任何一处能把后端的信号回传到前端、去触发修正。没有反馈,就没有修正。

更进一步,问责本身也被切成了一段段,而每一段都只对自己眼前的短周期指标负责。小学老师的考核周期是一个学期、一次统考,他在理性上就应当把学生优化到"这学期的分数",二十年后的事,既不在他的视野里,也不在他的考核里。家长的认知半径受限于自身走过的路与所能获得的信息,他看得见"别人家的孩子上岸了",却看不见这条路在源头偷换了什么。等孩子进入大学、研究生阶段,他已是被前二十年塑形完成的半成品,导师能做的,只是在既定的存量上修补。每一个环节都在做自己那一段的局部最优,而这些局部最优之和,恰恰逼近全局的最差,这正是前述"局部最优陷阱"在制度层面的放大。

必须强调:这不是"认知不够"的问题,否则又会滑回对个人的劝诫。真正的症结是位置决定视野、激励决定行为:即便每个人的认知都完全到位,只要考核仍是切段的、短周期的,处在每一段里的理性人,依然会做出同样的选择。你无法要求一个按学期被考核的老师,去为二十年后的结果负责;那从来不是觉悟问题,而是激励问题。

这也就划定了"怎么解"的真实边界:既然没有任何人能站在看得见完整因果链的位置上,那么试图靠"提高每个人的认知"来修复它,注定徒劳。可行的方向只有两类。要么想办法把那条被拉断的长反馈部分地接回来、或缩短(顶端"终身兜底"式的问责下沉,正是把回路在末端重新焊上的一次尝试,详见下节);要么,干脆承认这条链注定接不回来,转而从"下注结构"上去降低单点误判的代价。后者更诚实,也更根本。

十一、机制是可以被重新设计的:一个正在发生的纠偏

如果前面的诊断成立(病根不在"该不该罚",而在"罚谁、由谁兜底"被设反了),那么它同时给出了一个可检验的预言:只要把问责的位置扳回到真正的获益者身上,激励结构就应当随之改变。而这正是近期开始出现的信号。

据公开通报,2026年5月,同济大学、南开大学、中山大学先后就本校涉嫌学术不端的问题论文完成调查并公布处理结果,涉事的通讯作者多为手握国家级人才头衔(如"国家杰出青年科学基金"获得者)的"帽子人才"。处理的力度属近年罕见:以同济为例,涉事通讯作者被免去生命科学与技术学院院长职务、由二级教授降级为副教授,第一作者被解除聘用;南开、中山则分别免去了相关学院院长、副院长等职务,并对多名涉事人员作出处理。值得一提的是,这一系列调查的导火索,正是举报者揭出的那种"顶着耀眼头衔、数据却荒诞粗糙"的造假:其低级程度,被概括为连随机数生成器都未曾使用。这与本文开篇所描述的反常现象,是同一回事。

这一处理之所以值得在机制层面认真对待,在于它针对的恰恰是本文反复指出的那个制度病灶。长期以来,国内对学术不端的处置存在"重基层、轻高层,重学生、轻导师"的失衡:真正从论文中获益最多的人,往往被圈层保护所豁免,而代价被转嫁给最底层的执行者。这种"获益与担责相分离"的安排,本身就是逆向选择得以持续运转的制度保障:它让走捷径的人净获益,让兜底的人净受损。

把问责下沉、要求通讯作者为论文质量"终身兜底",在机制上等于改写了那道由结构出的题:当署名不再只是收割声誉、而要对应可追溯的、长期的风险,理性的署名者就有了核验原始数据、复盘实验流程、拒绝存疑稿件的内在动力;这种自上而下的约束,会沿着师生链条传导,倒逼实验室建立原始数据留存、组内交叉审核、重复验证等制度。可以预见,这会在短期内抬高青年研究者的发表门槛、增加基层压力;但这恰恰是把激励从"产出速度"重新校准回"成果可靠"所必然伴随的阵痛。

而比阵痛更值得期待的,是这一转变可能触发的一个连锁反应,它恰好对应着本文第十节提出的那个难题:如何把被时间拉断的反馈回路重新接上。

第一步,是需求侧对那种被淘汰的特质的"重新定价"。一旦通讯作者必须为数据真实性终身兜底,他最缺、也最愿意为之付费的,就是"能在论文出门之前挑出毛病的那双眼睛",也就是高敏感度的鉴伪能力。而这,恰恰是前面被逆向选择筛掉的那批人最稀缺的本事。于是机制第一次开始主动寻找他们,而不是排斥他们。

第二步,是为这种能力开辟专门的通道,让高敏感者去做他们最擅长、过去却无处安放的事。设想把"学术侦探"型的人才制度化:不再让他们只能在体制外打假,而是请进体制内,担任投稿前的第一道关卡:做原始数据复核、图像查重、可重复性审查。这一步的深意在于,它正好反转了第六节描述的那种尴尬:监督本被迫外溢到体制之外,如今重新回到内部,而且是由那些本该在内部、却因受不了"卷"而被筛走的人来承担。这等于为高敏感者开出一条新的职业路径:不必再忍受无意义的重复,却能凭其核心天赋立足。换言之,前文那位以"独立核查"揭出顶刊造假的人,他所做的事一旦被制度需要、被赋予正当位置,本身就是一种通道的拓宽。

第三步,也是最关键的一步:这种新需求会沿着师生链条,把信号一级级回传到源头。当"能查错、对真实负责"开始变得值钱、且有明确出路时,导师会开始看重它,研究生培养会开始保护它;假以时日,这个信号会继续上溯,渗入大学选拔、乃至中小学教育与家长的认知:"较真、对异常敏感"不再被当成"不合群、拖慢刷分"的缺点,而被重新识别为一种有市场、有前途的禀赋。

这正是修复那条"断掉的长反馈"的可行办法。它并不要求一位按学期被考核的小学老师凭空具备二十年的远见,那既不现实,也不公平;它要做的,是让顶端对某种特质的真实需求,转化为一个能沿链条向下传导的价格信号。信号传到哪里,哪里的人即便看不到终点,也会自然地停止磨平这种特质。一旦这条回路接通,整台原本"开环"的机器,便有了第一次自我修正的可能。

需要保持的审慎是:单点的从严处理还不等于稳定的制度,它能否固化为常态、能否同时为"做真但慢"的人留出通道(而不只是更严地惩罚造假),仍有待观察。但无论如何,它至少印证了本文的基本立场:这套筛选并非天命,而是一组可被识别、也可被重新设定的旋钮。诊断机制的意义正在于此:找到那几个真正起作用的旋钮,复杂的矛盾才谈得上化解。

结语:摸清机制,才能解决问题

把整条链收拢成一句话: 这套机制在系统性地用低敏感度替换高敏感度。 造假的潦草、原创的匮乏、监督只能靠外部、最认真的人反而付出最惨的代价,看似四件事,其实是同一次替换的四个侧面。

之所以全程只谈机制、不评判个人,是因为本文相信:单纯加重对编造者的谴责或惩罚,是治标的;只要那个"以卷为闸门、以可博弈指标论英雄"的选拔结构不变,被它选拔上来的,永远是伪造时几无心理负担、行事果决的那一类;而被它筛除的,永远是兼具原创力与鉴伪力、却在两条路径上都承受更高耗损的那一类。即便更换一批人,结果也不会改变。

如果这个解释成立,治本的方向也就清楚了:改造评价与选拔机制,使它 能够容纳乃至偏好高敏感度的人 :容忍慢、容忍试错与探索、容忍前期不出"指标性成果",给那些对异常点敏感、却受不了无意义重复的人留一条活路;把"误差压缩"的奖励,从"指标产出的速度"转回"真实能力的增长"。这些都是机制层面可以动手的旋钮,而不是对人心的劝诫。而真正的旋钮还不止在学术内部,它一直延伸回我们如何从小分拣孩子。只在终点处修补,治不了一台从起点就在运转的机器。

而在所有旋钮里,最根本的一个,恰恰来自承认前面那个无法消除的困难:既然没有人能预测一个六岁孩子二十年后最适合走哪条路,那么把所有孩子押注在同一条赛道上,本身就是一种系统性的高风险设计。降低这种风险的办法,不是奢求"预测得更准",而是保留多条通道、允许更晚的分流、允许试错与回头,把前文所说"真正的高手早年广泛探索、不急于专业化"那条个人经验,上升为制度安排。通道越单一,长反馈断裂的代价就越致命,一次源头的误判便可能锁死一生;通道越多元,单点的误判就越不容易酿成绝路。如果说顶端的"终身兜底"是在末端把断裂的回路重新焊上,那么在起点处保留多元的通道,则是在我们注定看不清终点时,为整整一代人预留的容错余量。这两者一末一始,才共同构成对这台开环机器的真正修补。

之所以值得如此认真地对待这套选拔规则,并不是为了评判谁高谁低,而是因为:当"越认真越吃亏、越随便越高产"被写进了选拔规则本身,它产出的就不只是若干组潦草的伪造数据,而是一代人在"什么样的人理应向上流动"这一问题上的系统性错配。看清这台机制如何运转,是矫正它的第一步,也是无法跳过的一步。

最后,把这套机制还原成一句最朴素的话: 假的,终究真不了;而造假,其实也很累。 之所以仍有人源源不断地走上这条路,恰恰因为他们的敏感度不足:既感受不到造假的煎熬,也算不清那笔最关键的账:被裹挟上船时看似省力、高产,可真相并不会消失,它只是带着复利,在某个时点等待结算。于是这条路的真正特征不是"逃脱",而是"延迟":上了船的人一路狂奔,把清算的时刻不断后推,直到在某个节点被一次性兑现:那位走到顶端、却连随机数生成器都未加使用的学者,与那位随手把数字改小、以为无人会去核对的学生,并不是两类人,而是同一条曲线上先后到达结算点的两个坐标。机制能决定一个人能跑多远、多久才被追上,却从不能取消那场结算。理解了这一点,也就理解了为什么唯有看清机制、而非诉诸道德义愤,才谈得上真正化解这重矛盾:因为要改变的,从来不是人性,而是那套决定"什么样的人能上船、又能在船上待多久"的规则。

转载本文请联系原作者获取授权,同时请注明本文来自王春艳科学网博客。 链接地址: https://blog.sciencenet.cn/blog-42659-1537380.html

上一篇: 教学三十二年:对几个老问题,到今天为止的一些理解

主题:潦草|结构|造假|"刻意练习"|刻意练习