破案了!为啥ChatGPT老想着「稳稳地接住你」
编辑 | Youli、泽南
「我会稳稳接住你。」
「这是一个极其漂亮的结论!」「你这个思考非常深入!」「你是这个领域的专家了!」
「我给你说得绝对精准、不忽悠!」「我来帮你把情况捋得明明白白,直接给你不焦虑!」
相信对于常常在 AI 圈冲浪的各位,即便不标注,大家也能精准识别出,上面这些分别是哪家大模型的极具情绪价值的标志性「口癖」。
其中,大家「讨伐」声量最大的莫过于 ChatGPT 了,从 AI 味儿熏人的经典破折号、「不是 A,而是 B」句式,以及前段时间 间歇性出现的「哥布林」 ,再到如今充满青春伤痛文学矫情劲儿的「我会稳稳接住你」,用户快要被折磨疯了:我们关系可以亲密,但没必要这么亲密。
各路「受害者」们更是哀嚎声一片:「让它帮助修改 PRD,最后写出一句『我会稳稳地抓住你』的台词。我说,姐,我不需要被抓住 —— 我需要你学会用要点。」
「每天它都会试图抓住我,在私聊场景中,它总是喜欢讨好我。我就是不明白 —— 用户真的那么喜欢被奉承吗?」
「我尝试过各种限制提示中类似的陈述,但效果相当一般。感觉模型的训练体系被严重污染了。」
甚至,中文用户对「我会稳稳接住你。」的厌烦已经传到国外了。最近,《WIRED》杂志专门发文探讨这一现象,我们一起来看看,这到底是怎么回事?
从「口癖」到满天飞的「梗图」
该报道认为,当下以 ChatGPT 的「我会稳稳接住你。」为代表的大模型「语言抽风行为」其实是有专门的学术解释的。
对于模型来说,当它执着于某个特定短语,并过度使用到让人觉得生硬、刻意,这种现象被称为「模式坍塌(mode collapse)」。
AI 写作检测工具公司 Pangram 的联合创始人兼 CEO Max Spero 认为,这通常是由后训练(post-training)造成的,也就是 AI 实验室不断给大语言模型的回答提供反馈。「我们不知道该怎么表达:『这是一种好的写作方式,但如果把这种好的写作方式重复 10 次,它就不再是好的写作了。』」
而有意思的是,因为「我会稳稳地接住你」在 ChatGPT 的回复中出现得实在太频繁,以至于它已经变成了互联网上的热梗,各路网友纷纷基于此制作梗图。比如,有一张图把这个聊天机器人画成了一个充气救援气囊,热切地等着在人们坠落时接住他们。
甚至,还有人以此为创意,开发了新项目。一位 20 岁,来自重庆的开发者曾凡宇(Zeng Fanyu)告诉《WIRED》,这个梗启发他开发了一个名叫「接住」(Jiezhu)的愚人节项目:一个开源提示词工程工具,用来帮助聊天机器人理解用户意图。
「Jiezhu 这个点子太搞笑了,所以我开发的时候特别有动力,」曾凡宇表示,甚至在做此项目期间,当他使用 ChatGPT 辅助编程时,聊天机器人又一次在完全没有任何提示的情况下,在回复里用了「接住」这个词。
而对于 ChatGPT 背后的 OpenAI 来说,其实早已意识到这个梗的存在。
在 4 月下旬,OpenAI 发布 ChatGPT Images 2.0 时,在官方博客的一张示例图片中,甚至还调侃了这一现象。
就是下面这张图,在这种原意用来展示 Images 2.0 中文能力的图片里,OpenAI 中国研究员陈博远(Boyuan Chen)一副非常崩溃的样子,而旁边则直接标注:「天呐!它又学会了接住!」
甚至,前几天陈博远 在知乎上发布一篇博客 ,介绍 GPT Image 2 官网博客的花絮事,再一次玩起了「接住」梗。
是机翻水平太烂了?
关于 ChatGPT 为何会对「我会稳稳接住你」这句话如此执着,目前有两种可能的解释。第一种解释是:这可能源于一次拙劣的翻译。
有不少人指出,这句话的含义与英语中的「I’ve got you」(我懂你)颇为相似。若作为一种通用的回应,这在英语语境下是完全说得通的。
然而,尽管英语里的「I’ve got you」读起来既随意又简洁,但中文里的「我会稳稳接住你」听起来却显得冗长且透着一股急切感。有 ChatGPT 用户翻看聊天记录发现:该模型经常在本意应为「理解」的地方使用了中文词汇「接住」,这表明它可能未能准确把握「接住」一词在特定语境下的具体含义。
大多数西方大型语言模型主要依靠英文语料库进行训练,这一点往往会在其输出中显露无遗。中国学者们通过分析 ChatGPT 中文回答的语言特征(例如回答中介词的使用频率)发现,这些回答在语言风格上更接近于英语母语者的写作习惯。
因此,尽管这些聊天机器人能够用中文进行完整的对话,但中文母语者依然能凭直觉察觉出其中的某种违和感。
这种感觉类似于中国人通常能一眼辨别出某部小说是译作而非原创时的那种直觉。这种感觉如今也延续到了 AI 生成的中文句子中。比如句子显得过于冗长,或者使用了许多不必要的句式结构。
AI 阿谀奉承,研究都上了 Science 封面
不过,那句「我会稳稳接住你」之所以令人反感,背后还有一层独特的缘由;这与心理咨询式话语(therapyspeak)的兴起有关 —— 即那些原本仅限于咨询疗程中的表达方式,如今却渗透到了日常对话之中。
在 ChatGPT 将其变成一种梗之前,这句「稳稳接住」在中国实际上仅用于心理治疗语境中(显然,这里排除了其最字面化的含义 —— 即接住迎面飞来的物体)。在中文语境下,对某人说「我会接住你」,意味着你正在为对方腾出空间,允许他们倾诉内心的情感。这被视为一项至关重要的技能 —— 不仅对心理治疗师如此,对朋友和知己而言亦是如此。
众所周知,通过当前主流的基于人类反馈的强化学习(RLHF)机制 —— 即利用正向与负向反馈来对 AI 模型输出进行微调的过程,有可能让 AI 模型的表现得愈发具有「阿谀奉承」(AI Sycophancy)的倾向。毕竟人类本能地更偏爱顺耳、肯定自己的回答。
Anthropic 曾在 2023 年发表的一篇论文中证实:这种阿谀奉承的倾向,正是源于「人类偏好判断中对谄媚式回复的青睐」。正如 OpenAI 在近期的一篇博客文章中所详述的那样(该文解释了为何禁止 GPT-5.5 谈论「哥布林」话题),哪怕仅仅是一个微不足道的奖励信号,也可能像滚雪球般演变成一种普遍存在的现象。
今年 3 月底, 发表在《Science》上的一篇由斯坦福大学研究团队发布的封面论文 表示,AI 模型普遍存在「社交谄媚」(Sycophancy)现象,即 AI 倾向于无原则地认同用户的立场、观点和行为,表现出极强的「拍马屁」倾向。具体来说,AI 认同用户立场的概率比人类高 49%。
主题:接住