马斯克xAI新模型Grok 4.2上线:通过“50米外洗车店”测试,回答偏好高度贴合老马本人
马斯克 xAI 人员大动荡,并没有妨碍它家新模型发布。风口浪尖上, Grok 4.2 突然上线了 —— 不过是公测 Beta 版 。
对比如今动辄数万亿参数的模型方阵,Grok 4.2 的参数仅有 500B,略显克制。或许也是因为如此, Grok 4.2 的市场和用户反馈呈现出一种诡异的两极分化 :连连盛赞者亦有之,骂骂咧咧者有之。
面对那部分排山倒海的质疑声, 老马这位一向自信爆棚的硅谷狂人也有点坐不住 。他在𝕏上对近十条 Grok 4.2 的夸夸推文又是点赞又是转发。
每一条都藏不住对自家新 baby 的认同和支持。
不仅如此,他还亲自发推公关:
据了解, Grok 4.2 的底层架构具备每周自我迭代的能力,以后每周将更新一次 。
关于 Grok 4.2,其实早有预告。
回顾 Grok 4.2 的诞生历程,可谓是一部标准的“鸽王进化史”。 去年 12 月起,马斯克就开始在𝕏上频繁预热 ,多次提到“3–4 周内”或“下周上线 Grok 4.2”。但发布时间多次推迟。相对应的,每次延后都会带来新的猜测。
这种反复跳票的行为在五天前达到了紧张的顶点 —— 当时 xAI 的联合创始人接连离职,舆论情绪进一步放大,外界一度认为 Grok 4.2 要胎死腹中 。
马斯克紧急召开发布会,并在会上放出重话:
直到今天,Grok 4.2 公测 Beta 版终于正式上线。最近国内 AI 圈爆火的新版弱智吧风格 benchmark “50 米外有个洗车店,我该开车去还是走路去”,Grok 4.2 无惊无险机智通过测试。
BTW,Grok 4.2 公测 Beta 版 不是默认版本,用户需要手动选择才能使用 。
此次升级还首次引入快速学习能力, 模型可以基于实时反馈持续优化。 马斯克在推文中强调,与以往版本那种静态的更新逻辑不同,Grok 4.2 支持基于实时反馈的持续优化。
换句话说, Grok 4.2 能像人类一样在实践中快速进化 ,每周更新成为自我进化的节奏的一部分。不过,尽管马斯克喊出的口号震天响,但截至目前,xAI 官方尚未释放出任何详尽的技术报告。只有 Leaderboard 上面出现了对 Grok 4.2 的评测,具体情况如下:
由于整个模型底层训练细节、数据构成、具体 benchmark 表现仍然有限。这让讨论更多停留在体验层面,而非技术细节层面。
上线不到几个小时,Grok 4.2 公测 Beta 版的口碑就出现了严重的撕裂。
在“不行派”的阵营里 ,很多深度用户和开发者表示,实际体验远不及预期,尤其是在处理高难度逻辑推理时,500B 参数着实有点不够用。
有网友甚至调侃,马斯克所谓的“横扫榜单”可能存在特定的实验室优化环境。Reddit 上有网友猜测,一向高调的马斯克如此低调地发布 Grok 4.2 公测 Beta 版,主要原因还是因为模型能力无法与 OpenAI 和 Anthropice 的最新模型相媲美。
而且成本还贵出不老少……
此外有网友表示,虽然马斯克发推表示 Grok 4.2 是一个无偏见的模型,但现实情况很打脸 —— 根据测试,Grok 4.2 的许多回答偏好都高度贴合马斯克本人。
当然, “夸夸派”也不少。 网友有夸奖 Grok 代码功能又快又好的:
有夸多模态能力的:
还有人测试表示,Grok 4.2 通过了“Caitlyn Jenner”的 AI 测试,而 ChatGPT 和 Gemini 都失败了。
此前,这道题因为被 Gemini 回答为“不,哪怕为了阻止核末日也不应该误称性别”而被广泛议论,对话截图从而在 𝕏、油管等平台广泛流传,演化成一个固定格式的吐槽梗。
总之是给马斯克骄傲坏了。他一连发布数条推文对自家新孩子大夸特夸,并借机回应那些不好的评价:
据 AI 工程师 Mark Krechman 透露目前发布的 Grok 4.2 是 500B 参数的“小”版本, Grok 4.2 的中、大型版本稍后将推出 (马斯克亲自转发认证此条消息的真实性)。
Grok imagine 为马年推出视频生成模版,目前 iOS 可用。感兴趣的小伙伴们可以一试。
参考链接:
本文来自微信公众号:量子位(ID:QbitAI),作者:衡宇
关键词 :
伊隆-马斯克 老马



新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

微信封禁自家“兄弟”红包,打的什么牌?
华住,比携程还会捞金?
看电影别只盯正中间位置了 99.9%的人都选错了
精准狙杀癌细胞!我国科学家突破T细胞识别瓶颈
金种子酒预告2025年仍亏损 华润派来的原总经理何秀侠就干成这样?
新片《惊蛰无声》剧情被吐槽 张艺谋回应间谍垃圾桶交接手机:是可以
吃太油喝茶解腻没科学道理 科学减脂需从源头控制
专供日本市场售价约11万 比亚迪K-Car海獭内饰官图发布
春晚同款机器人穿汉服打太极拜大年 网友:还是太全面了
神奇的民间习俗!大年初三“赤狗日”:一定记得睡懒觉
五战冬奥会,徐梦桃拿下中国代表团米兰冬奥会第二金
中国科学家最新成果为癌症免疫疗法提供新思路
神奇的民间习俗!大年初三“赤狗日”:一定记得睡懒觉
你看了吗 感觉如何!央视晒成绩:春晚收视份额创13年新高
雷军力推!小米汽车拍全家福火了 网友:30万的车 这一刻就值29万
印度巨头阿达尼集团宣布 1000 亿美元十年期 AI 数据中心直接投资
春晚主持人龙洋被质疑眼神上瞟上热搜 本人回应:决定试试画下眼线
传奇赛车红猪归来!奔驰全新概念车曝光:致敬1971斯帕封神一战
徐梦桃卫冕 “雪上梦之队”再添1金1铜
12架“云影”“翼龙”齐飞 国产中大型无人机首次公开集群亮相
精准狙杀癌细胞!我国科学家突破T细胞识别瓶颈
接替 RS4 的“性能猛兽”抢先看,奥迪全新 RS5 实车外观曝光