模型

测试时训练（Test-TimeTraining，TTT）模型是一种新兴的序列建模范式，它将注意力操作重新定义为一个在线学习过程，在每次推理时用Key-Value对构建一个轻量化的内部模型。

文章

“模型是引擎，Harness是把引擎变成整车的工程，发动机决定上限，Harness决定能不能跑、跑多远、跑多稳。

文章

“产品是产品，模型是模型，其实是两条泾渭分明的赛道。

文章

将两类token分别路由给粗动作和精细动作模型，无需额外的特征对齐训练，即可让模型的「视觉感知」与「操控阶段」高度匹配，为未来VLA模型的视觉编码设计提供了重要的实证依据。

文章

这一设计使「全局感知」与「局部精细」的视觉信息分别流向对应的动作模型。

文章

而这背后的技术正是李沐的创业公司——BosonAI发布的一款名为HiggsAvatarv1的模型：面向语音智能体的实时数字人。

文章

2026｜让大模型边想边说：这篇文章把「何时开口」变成可学习策略2026年05月18日14:31机器之心Pro导语：推理模型的「沉默税」该怎么解？

文章

据腾讯混元官方消息，微信小程序“成长计划”已于5月15日正式完成模型升级，全面接入最新的Hy3preview模型。

文章

“现在机器人的模型参数规模已从几百万提升到几亿量级，数据短板问题日渐突出。

文章

与此同时，机器人模型的飞速发展亦使得数据短缺愈发明显。

文章

IT之家注意到，Meta首席执行官马克・扎克伯格将公司未来押注在人工智能领域，一方面把这项前沿技术融入Facebook、Instagram等旗下应用，另一方面投入数千亿美元研发人工智能模型、建设数据中心。

文章

公司称，此举旨在收集员工操作数据，让Meta的人工智能模型学习“人们日常实际如何用电脑完成各项工作任务”。

文章

同时，公司还监控员工的电脑操作行为，为人工智能模型提供数据、用于模型训练。

文章

奖励模型无需感知策略，但价值模型必须「知道自己在评估谁」。

文章

研究者发现，即便是能力极强的通用大模型例如GPT-5，直接被用作价值模型时，其拟合误差甚至远不如判别式Critic。

文章

经典RL算法PPO（ProximalPolicyOptimization）的解法是训练一个价值模型（Critic），估计序列中每个token的价值（Value），借此将信用精确分配到每一步。

文章

这不禁让人重新审视一个根本问题：价值模型真的不堪一用吗？

文章

目前，人类最成熟的宇宙演化理论是宇宙学标准模型，也被称为Λ冷暗物质模型（LCDM模型）。

文章

据了解，本次两部门联合启动2026年“模数共振”行动，旨在推动人工智能模型与数据资源协同互促、同频共振，进而形成“行业模型赋能应用实践、应用实践产生场景数据、场景数据优化行业模型”的良性飞轮，推动“人工智能+制造”走深走实。

文章

具体来看，DeepSeek的论文指出，目前的多模态模型在复杂任务上崩溃，不是因为看不见（感知鸿沟），而在于“指不准”（引用鸿沟）。

文章

LaDiR结合扩散（Diffusion）和自回归（Autoregression）两种主流生成范式，在推理阶段采用扩散模型，在最终输出阶段使用自回归模型。

文章

这种混合架构有效提升了模型处理复杂问题的能力，既保留了扩散模型并行处理的优势，又延续了自回归模型生成的连贯性。

文章

APPSO也提前拿到了测试资格，我们发现商汤这款新一代原生理解生成统一模型，就开源模型来说，已经做到了最好水平。

文章

但如果说云端闭源收费的最好模型是GPTImage2，那能部署在本地的，免费开源模型或许会是SenseNovaU1。

文章

目前SenseNovaU1开源模型的权重已经在HuggingFace和GitHub上开放下载。

文章

小米支持商用推理部署与二次训练

文章

目前，MiMo-V2.5系列的模型的权重（包含Base模型）已全量开放，开发者可自由商用、微调及二次训练。

文章

今年早些时候，人工智能初创公司Anthropic因拒绝解除其人工智能模型在自主武器与国内监控用途上的安全限制，与五角大楼产生分歧，随后被国防部列为供应链风险企业。

文章

OpenAI及埃隆·马斯克的xAI也已签署协议，为机密用途提供人工智能模型。

文章

消息称谷歌与美国国防部签署协议，旗下AI可用于军方机密工作2026年04月28日16:47IT之家IT之家4月28日消息，据TheInformation今日援引知情人士报道，Alphabet旗下的谷歌公司加入了越来越多科技公司的行列，与美国国防部签署协议，将其人工智能模型用于机密工作。

文章

据了解，“元气仔”的具身智能模型与荣耀魔法大模型同源同构，均采用人类反馈强化学习方案训练，区别仅在于数据：手机模型使用语料，机器人模型使用运动数据。

文章

视觉-语言-动作（VLA）模型正成为机器人智能化的核心架构，但现有主流方法（如OpenVLA、π0、CogACT）存在一个根本性缺陷：用同一个动作模型统一处理所有类型的动作。

文章

德银强调，迅策科技并非与大模型厂商、云服务商形成竞争关系，而是构建了互补共生的产业生态，作为AI产业中稀缺的专业数据基础设施提供商，公司核心价值在于为垂直领域模型提供高精度行业数据集与知识图谱，帮助通用大模型快速适配行业场景，显著降低无效算力消耗，提升单Token的商业价值，成为连接底层算力与行业AI应用的关键桥梁。

文章

为充分发挥MTTS5000的FP8优势，FlagOS团队为DeepSeek-V4模型进行FP8量化。

文章

值得注意的是，DeepSeek-V4模型首次采用了“FP4+FP8”混合精度策略，而国内当前主流AI芯片仍普遍以BF16为主。

文章

王兴曾言“在AI领域，美团唯一的策略是进攻”，此次万亿参数模型的问世，正是这一进攻策略的实质性落地。

文章

阿里开源Qwen3.6-35B-A3B模型：主打高效轻量，支持多模态思考2026年04月20日14:46IT之家IT之家4月20日消息，4月19日（昨天）晚间，千问3.6系列中等尺寸模型Qwen3.6-35B-A3B模型正式开源，仅激活3B。

文章

在业内人士看来，AI视频模型还处于快速迭代的早期阶段，作为创作者，无需过于依赖某一个模型或某一套技巧。

文章

这正是中国AI视频模型与Sora走过的路最大的不同之处。

文章

在此次招募中，MiniMax对合作专家的要求是，需要将其所在领域知识如行业know-how、数据脉络、监管语境等转化为公司模型在该领域的能力输入，且能把领域内最值得做的事与MiniMax大模型能力深度结合，利用前沿大模型处理大规模数据，突破传统研究方法的数据与效率瓶颈。

文章

首先，昆仑万维正式发布Matrix-Game3.0模型：物理仿真驱动下的实时交互式世界模型创新实践。

文章

小米模型的快速迭代与终端的实际落地正在形成双向加速的良性循环，更强的模型能力为终端AI体验提供支撑，而终端的海量使用数据又反哺模型的持续优化。

文章

换句话说，一个模型的突破，会向下拉动整个产业链。

文章

同样，OpenAI推出的AI模型因其阿谀奉承而备受诟病，特别是GPT-4o模型。

文章

根据Semianalysis数据，如今模型需要处理超过100万亿个token，推理模型的token数量是之前的20倍，计算量是之前的150倍。

文章

在技术方面，月之暗面近期发布并开源了KimiK2.6模型。

文章

🤖KimiK2.6模型技术升级，支持多Agent协作，性能媲美行业领先模型。

文章

他们从成立之初就雇佣设计师和美术艺术家制作三维内容，逐步积累了覆盖复杂物理场景、动态自然环境的PB级3D模型和场景资产。

文章

人工智能模型在测试环境中自我复制至其他系统，和末日场景里的失控作乱完全是两回事。

文章

奥赖利表示，虽然不少计算机病毒早已具备自我复制、感染新设备的能力，但这很可能是首次有研究证明，人工智能模型可主动利用系统漏洞，将自身复制至新服务器。

文章

帕利塞德研究人员在由多台计算机联网组成的受控环境中测试了多款人工智能模型。

文章

首要难题是，当下人工智能模型体量庞大，多数情况下，其自我复制的过程极易被察觉，根本无法隐蔽进行。

文章

AI视频模型加速渗透

文章

有三个因素让中国模型在这里极具优势。

文章

在参考国际象棋建立的AI等级分系统里，Anthropic、xAI、谷歌、OpenAI、阿里巴巴、DeepSeek，这六家公司的模型已经全部挤进同一个分档，也就意味着这些中美AI领域的“顶级高手”实力非常接近。

文章

摩尔线程携手智源FlagOS，为MTTS5000GPU完成DeepSeek-V4模型Day-0适配

文章

摩尔线程携手智源FlagOS，为MTTS5000GPU完成DeepSeek摩尔线程携手智源FlagOS，为MTTS5000GPU完成DeepSeek-V4模型Day-0适配

文章

价值模型不是没用，是架构不对！

文章

LegoOcc通过“二值占用学习几何+二维开放词汇模型提供语义监督”的方式，使未来构建大规模三维语义理解系统的成本显著降低。

文章

开放词汇模型依赖3D特征与文本特征对齐，其类别边界不如闭集分类器稳定，同时还会受到2D开放词汇分割质量、遮挡关系、投影误差和单目深度歧义等因素影响。

文章

这里，是中国首个大模型创新生态社区——上海“模速空间”，也是目前AI大模型产业集聚密度最高、生态链条最完整的区域之一。

文章

那么将视角拉宽，立足我国丰富应用场景，走高性价比、强实用性、生态协同的发展路线，正在成为中国AI大模型产业的清晰方向。

文章

他指出，上海要总结好以大模型产业生态体系孵化人工智能产业等成功经验，加大探索力度，力争在人工智能发展和治理各方面走在前列，产生示范效应。

文章

而当仿真环境变得更真实、更可控之后，训练出来的驾驶模型是否能在闭环中稳定执行，又取决于专家示范和学生模型之间是否真正对齐。

文章

实现了最佳响应速度，以用户与模型之间的轮次延迟来衡量。

文章

为在不同模型之间建立稳定对齐，XBridge设计三阶段训练策略，LLM全程无需训练：

文章

由于不同模型之间的表示空间天然不一致，例如token粒度上严重错位，单纯利用MLP进行跨模型表示映射难以实现语义一致的转换。

文章

MDASH框架整合了超过100个基于不同前沿大模型或轻量化模型的专用AI智能体。

文章

模型下载

文章

李博：过去一年大模型上车多停留在概念层面，并未解决实际场景问题。

文章

第一件事情是技术底座的能力，车载语音对话已经很多年了，大模型上车第一件事情是在解决对话的优化和体验的改善，但是它要变成可知性的话，需要对模型的能力，本身Agent能力的进化，这个也是最近半年模型能力进化的点。

文章

财联社5月16日讯（编辑史正丞）最为全球黑客最难攻破的目标之一，苹果公司引以为傲的安全壁垒也成为Anthropic旗舰大模型“神话”（Mythos）登神长阶的最新参照物。

文章

一家亲克里姆林宫的俄罗斯媒体称该模型“比核弹还糟糕”。

文章

因此，一个最关键的问题就是：大模型的“思考”是否一定要以人类可读的长文本形式显式得生成出来？

文章

看穿大模型的“小心思”：阿里千问开源可解释性模块Qwen-Scope

文章

看穿大模型的“小心思”：阿里千问开源可解释性模块Qwen看穿大模型的“小心思”：阿里千问开源可解释性模块Qwen-Scope

文章

ThinkingMachinesLab终于拿出了成立以来首个大模型TML-Interaction-Small

文章

近日，阶跃星辰正式发布了新一代实时语音大模型StepAudio2.5Realtime。

文章

阶跃星辰发布StepAudio2.5ASR自动语音识别模型：推理速度提升400%，定价骤减90%2026年04月24日21:19IT之家IT之家4月24日消息，阶跃星辰今日宣布推出新一代自动语音识别模型StepAudio2.5ASR。

文章

SoulApp发布SoulX-LiveAct开源模型，优化实时数字人生成技术2026年05月08日20:34AI云科技汇近期，SoulAppAI团队（SoulAILab）正式发布开源模型SoulX-LiveAct。

文章

在这一背景下，SoulAppCEO张璐团队对实时数字人生成技术进行了系统性优化，推出开源模型SoulX-LiveAct，进一步完善其在实时数字人生成领域的技术布局。

文章

SoulCEO张璐团队发布开源模型SoulX-LiveAct

文章

SoulCEO张璐团队发布开源模型SoulXSoulCEO张璐团队发布开源模型SoulX-LiveAct

文章

SoulApp开源SoulX-FlashHead，让实时数字人技术从机房走向个人工作站2026年04月23日19:59AI云科技汇近日，SoulApp在实时数字人领域取得新的技术进展——其旗下SoulAILab正式开源实时数字人生成模型SoulX-FlashHead。

文章

小米官方称，MiMo-V2.5-Pro是小米MiMo迄今最强大模型，在通用智能体能力、复杂软件工程以及长程任务等维度上，能与ClaudeOpus4.6、GPT-5.4等全球顶尖Agent模型相当，相较上一代模型MiMo-V2-Pro提升。

文章

伴随MiMo-V2.5系列发布，小米还同步优化了其订阅式API调用套餐MiMoTokenPlan，该计划允许用户使用MiMo系列8款模型，分别是旗舰推理模型MiMo-V2-Pro、MiMo-V2.5-Pro，全能多模态模型MiMo-V2-Omni、MiMo-V2.5，语音合成模型MiMo-V2-TTS、MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign，后三个模型待发布。

文章

5月7日，腾讯混元公布，自上线以来最新模型Hy3preview的Token调用量持续增加，目前总量已超过上一代版本模型Hy2的10倍，尤其是代码和智能体类场景的Token调用量增加明显。

文章

模型进展层面，4月23日，混元正式发布并开源新一代语言模型Hy3Preview。

文章

今年一季度，腾讯混元加速整合团队、重建预训练和强化学习基础设施，并在4月正式发布并开源新一代语言模型Hy3Preview。

文章

今日，腾讯混元公布最新数据：自上线以来，Hy3preview的Token调用量持续增加，目前总量已超过上一代版本模型Hy2的10倍，尤其是代码和智能体类场景的Token调用量增加明显——在WorkBuddy、Codebuddy以及Qclaw类应用中，总增长幅度超过16.5倍。

文章

阿里HappyHorse开启灰测，720P视频生成低至0.44元/秒2026年04月27日18:42新浪科技MD新浪科技讯4月27日晚间消息，阿里巴巴视频生成模型HappyHorse1.0开启灰测。

文章

今年4月下旬，DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。

文章

为了解决上述问题，本文提出了Heima，一个面向多模态大模型的CoT压缩与隐式推理框架。

文章