登录

哈佛“限A令”:美国高校分数膨胀的终结信号?


速读:而成绩的功能也主要是“区分能力”,帮助大学、研究生院与雇主识别谁真正卓越。 如果说哈佛今天的“限A令”是一次剧烈的制度纠偏,那么它所试图纠正的,其实是一场持续了半个多世纪的慢性病——美国大学的分数膨胀。 因为哈佛拥有极高的声誉资本,即便GPA下降,社会也不会因此怀疑其学生能力;
2026年05月26日 06:1

■郭英剑

根据日前哈佛大学官方校报《哈佛深红》报道,该校文理学院以458票赞成、201票反对的压倒性多数,通过了一项足以载入其教学史的重要改革:自2027年秋季起,本科课程中“A”等级成绩将被严格限制在班级人数的20%,最多允许增加4个A名额,即所谓“20+4模式”。换句话说,在一个100人的课堂中,获得A成绩的学生原则上不得超过24人。该提案获得约70%的教师支持,被视为哈佛几十年来遏制分数膨胀最激进也最具象征意义的一次制度干预。

消息一出,舆论震动。人们不禁要问:为什么哈佛率先对“A”开刀?

其实,答案很简单。并不单单是因为哈佛“太严格”,还因为一个长期存在且日益严重的问题——分数膨胀,已经迫使哈佛不得不采取行动。

根据哈佛本科教育办公室2025年发布的报告,在2024—2025学年,该校超过60%的本科生成绩为A,而20年前,这一比例仅约24%。换句话说,在短短20年间,A成绩的比例增长了一倍以上,优秀几乎成了“常态”。该报告直言,现有评分制度已无法发挥其关键功能,并正在“损害哈佛的学术文化”。

随之而来的问题是,当A变成了一种普遍现象,成绩还能否真正区分学术表现?当成绩失去辨识度,大学又如何向社会、雇主和研究生院证明“卓越”依然真实存在?

分数膨胀的历史

如果说哈佛今天的“限A令”是一次剧烈的制度纠偏,那么它所试图纠正的,其实是一场持续了半个多世纪的慢性病——美国大学的分数膨胀。

今天的人们已经很难想象,在20世纪60年代,美国大学里的A成绩曾经是种十分稀缺的荣誉。

根据长期关注美国高校评分问题的学者研究,在20世纪60年代初,美国高校A等级成绩比例仅约15%,平均绩点(GPA)为2.5。换言之,一个学生获得A意味着处于学术表现的前列。而成绩的功能也主要是“区分能力”,帮助大学、研究生院与雇主识别谁真正卓越。

事情很快发生了变化。许多研究者认为,美国高校第一次大规模分数膨胀始于越南战争时期。

当时,美国实行征兵制度,而大学生只要维持一定学业表现,即可获得延期征兵资格。这一时期,美国大学平均GPA由2.5升至接近2.9,A等级比例迅速升高,部分研究估计约为30%。有人将这一阶段称为“越战型膨胀”。它并不完全来自学术标准下降,而是在特殊历史情境下形成的一种制度性宽容。教师面对学生可能被送往战场的现实,倾向于给予更高分数,这种“同情性评分”后来成为美国大学文化中的一种潜在传统。

而真正决定美国高校评分体系长期走向的并不是战争,而是市场。

随着美国高等教育大众化,尤其私立高校学费不断上涨,学生越来越像“顾客”,大学则越来越像竞争激烈的服务机构。学校之间竞争排名、学费收入、校友捐赠与毕业率,教师则越来越依赖学生课程评价作为晋升与续聘的重要指标。

于是,一个微妙而现实的激励机制出现了。严格评分意味着学生不满、课程评价下降;宽松评分则意味着更好的课堂反馈与更小的教学阻力。

不少美国学者直言,在某种意义上,美国大学逐渐形成了一种“高分均衡”。因为所有人都在放宽标准,所以一位教师很难独善其身,否则便可能被学生评价为“不近人情”或“故意刁难”。

结果是,成绩越来越高,但其意义却越来越小。

根据一些学者的长期追踪研究,到2013年前后,美国高校平均GPA已达到3.15,而A等级成绩比例为45%左右。更值得注意的是,私立大学比公立大学更甚,GPA平均高出0.2以上,而精英私立院校则成为分数膨胀最显著的区域。

特别需要指出的是,进入21世纪以来,这种趋势进一步加剧。根据相关研究对1990—2020年美国高校数据的分析,中位GPA增长约21.5%,平均GPA从2.81升至3.15。尤其在新冠疫情期间,美国高校普遍采取更具宽容性的评价机制,包括通过/不通过的评分方式、延期考试、柔性评分以及心理健康优先政策,使分数膨胀进一步加剧。

当人人优秀时,优秀便不再稀缺;当A成为默认配置,成绩也逐渐失去了区分优劣的功能。更深层地看,分数膨胀损害的不仅是成绩本身,更是大学作为“学术共同体”的信任机制。因为评分制度原本是一种严肃的学术判断,它向学生、社会和未来雇主传递了一个信号:什么是努力、什么是能力、什么是卓越。然而,一旦评分越来越像一种情绪安慰、客户服务与制度妥协,大学也就悄然从“标准的维护者”变成“满意度的提供者”。

这也许正是哈佛今天不得不出手的真正原因。

当“A”成为平均分,大学还如何识别卓越

过去,人们通常认为成绩分布应当大致呈现金字塔状:少数顶尖学生获得A,多数学生处于B区间,C则代表基本达标。然而,在今天不少精英院校,尤其私立名校中,这种结构已经发生了根本性变化——A和A-成为“新平均”。部分高校A类成绩占比达到70%至80%,整体成绩曲线明显上移,最终形成一种奇特现象——“顶端压缩”。

所谓“顶端压缩”,指的是成绩大量聚集于高分区间,以至于优秀与良好之间的边界越来越模糊。换句话说,成绩作为评价工具,其“信号功能”正在弱化。

事实上,分数膨胀的后果比人们想象的更严重。

首先,受损的是学生自己。理论上,高分应该是一种激励,鼓励学生更加努力。但当高分变得容易获得,它反而可能削弱学习动机。越来越多美国学者担忧,一种“理性规避风险”的学习文化正在形成:学生不再问“什么课最值得学”,而开始问“什么课最容易拿A”。

于是,“shopping for GPA”(购买GPA)逐渐成为美国大学校园里的流行表达。部分学生倾向于避开评分严格的教师、数学与自然科学等挑战性课程,而转向评价宽松、作业较少、给分友好的课程。

这意味着分数膨胀最终可能悄悄改变学习行为:它奖励的未必是挑战精神,而可能是策略性选择;鼓励的未必是探索未知,而可能是风险规避。这与美国本科教育长期强调自由探索与学术冒险精神几乎背道而驰。

其次,成绩单越来越难以发挥社会识别功能。长期以来,GPA不仅是学校内部评价工具,也是一种社会信号——研究生院、企业招聘者、奖学金评审者据此判断一个人的学术能力与学习品质。而当越来越多的学生拥有接近满绩点的成绩时,这种信号开始“失真”。

不少美国雇主公开表示,仅凭成绩单越来越难识别真实能力。一些大型企业因此更加依赖实习经历、推荐信、面试表现以及能力测试;研究生院则越来越强调科研经历、写作样本与综合评价。

最后,分数膨胀还制造出新的不公平。表面上高分让所有学生受益,但实际上它常常以不均衡方式分布。在美国高校内部,不同学科、不同院系之间长期存在着显著的评分差异。研究发现,人文社科课程往往比理工类课程给分更高,小班研讨课又普遍高于大型基础课。这意味着,两名同样努力的学生仅仅因为专业不同、选课不同,就可能获得截然不同的GPA。

一个更深远的问题发生在大学之外。一些研究发现,高中阶段已经出现的严重分数膨胀,与后续劳动力市场表现之间存在负相关。因为高分环境削弱了真实的学习强度与知识积累,学生进入大学后,以及大学毕业开始就业后可能更难适应真实的竞争环境。

正因为如此,越来越多的美国教育研究者开始担忧,分数膨胀不仅影响大学内部秩序,更可能制造一种社会层面的“能力错觉”。

哈佛会改变美国大学吗

在美国高等教育体系中,哈佛从来不仅是一所大学,更是一个制度风向标。无论是本科通识教育改革、招生政策,还是近年来的恢复标准化考试要求,哈佛的选择往往具有极强的示范效应。它所释放的信号,常常会被其他精英大学迅速解读:如果连哈佛都开始这么做,这是否意味着整个行业的规则正在发生变化?

因此,当哈佛决定对“A”开刀时,它所引发的问题便不再只是“哈佛要不要限制优秀率”,而是美国大学是否正在重新思考“卓越”的意义。

这一点,从哈佛本科教育专业院长阿曼达·科莱博的公开表态中可见端倪。她明确表示,希望这一改革不仅改善哈佛自身的学术文化,也能“鼓励其他高校以同样的严谨与勇气面对类似问题”。换句话说,哈佛并不满足于“独善其身”,而是主动向美国高等教育抛出一个问题:当评分制度已经失灵,大学是否还有勇气恢复标准?

从积极层面看,这一改革确实可能产生“涟漪效应”。

首先,它可能推动美国大学重新建立学术评价的可信度。过去几十年,美国高校事实上陷入了一种“高分均衡”困境,因为所有学校都在膨胀,所以没有学校敢轻易收紧。否则,一旦本校学生GPA下降,在研究生申请、奖学金竞争和就业市场中便可能处于劣势。

而哈佛的特殊性正在于,它是少数有能力打破这种均衡的学校。因为哈佛拥有极高的声誉资本,即便GPA下降,社会也不会因此怀疑其学生能力;相反,严格评分甚至可能被视为质量信号。所以,如果哈佛成功,其他精英大学便更有可能跟进,从而逐渐形成一种新的行业规范,使高分重新具有稀缺性。

其次,这可能改变美国大学评价学生的方式。长期以来,美国社会过度依赖GPA这一单一指标,以至于一个小数点后的差距都可能影响研究生录取、奖学金评审与就业竞争。但若成绩分布重新拉开差距,未来大学、研究生院和雇主或许不得不更加关注“上下文”。诸如课程难度、班级百分位、教师评价、项目成果、跨学科能力以及真实学习经历等。换言之,评价逻辑可能从“你得了多少分”,逐渐转向“你是在什么条件下有怎样的表现”。

最后,它甚至可能反向改善教学文化。长期以来,美国高校广泛将学生课程评价作为教师聘任、晋升与绩效的重要指标。这种制度无形中强化了一种现实激励:教师越容易给高分,学生往往越满意。于是,一部分教师逐渐陷入某种“教学消费主义”困境——与其要求严格,不如降低难度;与其制造挑战,不如维持好评。如果评分制度重新变得严格,教师或许更有动力重新聚焦真正的教学问题,即如何提高课堂质量、激发思辨能力,而不是如何避免学生投诉。

话虽如此,哈佛的此次改革能否成功仍有待观察。

首先,根据学生媒体的调查,大约85%的哈佛本科生反对这一提案。他们担心,硬性限制A比例会加剧竞争,削弱合作氛围,并使其更不敢挑战高难度课程。同时,这一政策也会削弱教师的教学自主权。一些学生甚至认为,这会把哈佛重新推回一种“人为制造稀缺”的竞争文化。

与此同时,教师群体却表现出明显不同的态度。在最终投票中,约69.5%的教师支持设立A等级上限。他们认为,当前评分体系已经失真,如果大学无法重新建立评价标准,那么“优秀”终将失去意义,而成绩也将无法承担其应有的教育意义。

其次,之前曾有同类改革失败的前车之鉴。2004年,普林斯顿大学曾推出著名的“分数通缩”政策,试图将A类成绩控制在35%左右。改革初衷与今天的哈佛极为相似——恢复成绩区分度、遏制膨胀。然而多年之后,争议不断出现。一些学生抱怨,在研究生申请与就业市场中,自己相较其他高校学生“明显处于劣势”;而外部机构也并不总是充分理解“更低GPA意味着更严格标准”的道理。最终,普林斯顿大学在2014年终止了该政策。

普林斯顿大学的案例提醒人们,如果只有一所大学独自收紧标准,它可能会因“诚实评分”而遭遇竞争惩罚。这正是高等教育中的经典“集体行动困境”:所有学校都知道问题之所在,却都希望别人先改变。

即便如此,哈佛的改革仍意味着开启一种更深层的发展趋势。因为它真正触及的不是A等级比例,而是美国大学是否仍然过度依赖分数本身。

大学究竟该奖励什么

如果学习成绩只是安慰、激励与满意度管理,那么高分当然越多越好。但是,如果大学仍然相信学习意味着挑战、成长意味着区分、卓越意味着稀缺,那么评分制度便不能彻底失去边界。

虽然这一改革最终能否成功还有待时间检验,因为它既取决于制度设计是否足够细致,也取决于其他高校是否愿意共同回应这一问题,但可以肯定的是,哈佛已经点燃了一场无法轻易回避的讨论的导火索:当“人人优秀”成为常态,大学该如何证明卓越依然存在?

主题:成绩|分数膨胀|美国大学|A成绩|“限A令”