模型
描述
如果说芯片是地基、模型是引擎,那么百炼推理平台就是Agent真正跑起来的“生产车间”。
文章
如果说芯片是地基、模型是引擎,那百炼推理平台就是Agent真正跑起来的“生产车间”。
文章
测试时训练(Test-TimeTraining,TTT)模型是一种新兴的序列建模范式,它将注意力操作重新定义为一个在线学习过程,在每次推理时用Key-Value对构建一个轻量化的内部模型。
文章
在他看来,“AI厂商最核心的竞争力,也就是利润率最高的是模型,是自己的API售卖情况。
文章
“模型是引擎,Harness是把引擎变成整车的工程,发动机决定上限,Harness决定能不能跑、跑多远、跑多稳。
文章
分类
模型
将两类token分别路由给粗动作和精细动作模型,无需额外的特征对齐训练,即可让模型的「视觉感知」与「操控阶段」高度匹配,为未来VLA模型的视觉编码设计提供了重要的实证依据。
文章
这一设计使「全局感知」与「局部精细」的视觉信息分别流向对应的动作模型。
文章
5月22日晚,DeepSeek宣布,V4-Pro模型API价格将在5月31日结束2.5折优惠后,永久调整为原价的1/4(即降价75%)。
文章
这意味着,用户使用DeepSeek-V4-Pro模型的成本降至行业最低水平。
文章
ICML2026提出的TheoryofAgent(ToA)——以及它如何解释当下最前沿的长上下文、推理模型、工具使用、自进化智能体背后那根共同的主线。
文章
这解释了为什么推理模型(o1/R1那一代)把赌注押在「内部scaling」上——在它们的成本结构下,多推几步比调一次工具便宜得多。
文章
阿里发布千问Qwen3.7-Max模型:国产最佳,可全自主完成35小时长程任务2026年05月20日11:34新浪科技MD新浪科技讯5月20日上午消息,阿里巴巴发布新一代千问旗舰模型Qwen3.7-Max,在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。
文章
而这背后的技术正是李沐的创业公司——BosonAI发布的一款名为HiggsAvatarv1的模型:面向语音智能体的实时数字人。
文章
花旗将英特尔的目标价上调至130美元(较当前水平高出逾20%),同时上调其数据中心业务销售预测,以反映新的CPU市场模型。
文章
2026|让大模型边想边说:这篇文章把「何时开口」变成可学习策略2026年05月18日14:31机器之心Pro导语:推理模型的「沉默税」该怎么解?
文章
据腾讯混元官方消息,微信小程序“成长计划”已于5月15日正式完成模型升级,全面接入最新的Hy3preview模型。
文章
“现在机器人的模型参数规模已从几百万提升到几亿量级,数据短板问题日渐突出。
文章
与此同时,机器人模型的飞速发展亦使得数据短缺愈发明显。
文章
IT之家注意到,Meta首席执行官马克・扎克伯格将公司未来押注在人工智能领域,一方面把这项前沿技术融入Facebook、Instagram等旗下应用,另一方面投入数千亿美元研发人工智能模型、建设数据中心。
文章
公司称,此举旨在收集员工操作数据,让Meta的人工智能模型学习“人们日常实际如何用电脑完成各项工作任务”。
文章
同时,公司还监控员工的电脑操作行为,为人工智能模型提供数据、用于模型训练。
文章
奖励模型无需感知策略,但价值模型必须「知道自己在评估谁」。
文章
研究者发现,即便是能力极强的通用大模型例如GPT-5,直接被用作价值模型时,其拟合误差甚至远不如判别式Critic。
文章
经典RL算法PPO(ProximalPolicyOptimization)的解法是训练一个价值模型(Critic),估计序列中每个token的价值(Value),借此将信用精确分配到每一步。
文章
这不禁让人重新审视一个根本问题:价值模型真的不堪一用吗?
文章
目前,人类最成熟的宇宙演化理论是宇宙学标准模型,也被称为Λ冷暗物质模型(LCDM模型)。
文章
据了解,本次两部门联合启动2026年“模数共振”行动,旨在推动人工智能模型与数据资源协同互促、同频共振,进而形成“行业模型赋能应用实践、应用实践产生场景数据、场景数据优化行业模型”的良性飞轮,推动“人工智能+制造”走深走实。
文章
具体来看,DeepSeek的论文指出,目前的多模态模型在复杂任务上崩溃,不是因为看不见(感知鸿沟),而在于“指不准”(引用鸿沟)。
文章
工人们正赶着新一批的货,她们中有几个人头戴相同的黑色设备,这是用来采集训练具身智能模型数据的仪器。
文章
经过上传、清洗、质检、标注等流程后,合格的数据会输入具身智能模型,让模型更加理解真实的物理世界。
文章
工人们正赶制新一批货,她们中有几个人头戴黑色设备,这是京东采集具身智能模型训练数据的仪器。
文章
经过上传、清洗、质检、标注等环节后,合格的数据会输入具身智能模型,让模型更加理解真实的物理世界。
文章
LaDiR结合扩散(Diffusion)和自回归(Autoregression)两种主流生成范式,在推理阶段采用扩散模型,在最终输出阶段使用自回归模型。
文章
这种混合架构有效提升了模型处理复杂问题的能力,既保留了扩散模型并行处理的优势,又延续了自回归模型生成的连贯性。
文章
APPSO也提前拿到了测试资格,我们发现商汤这款新一代原生理解生成统一模型,就开源模型来说,已经做到了最好水平。
文章
但如果说云端闭源收费的最好模型是GPTImage2,那能部署在本地的,免费开源模型或许会是SenseNovaU1。
文章
目前SenseNovaU1开源模型的权重已经在HuggingFace和GitHub上开放下载。
文章
目前,MiMo-V2.5系列的模型的权重(包含Base模型)已全量开放,开发者可自由商用、微调及二次训练。
文章
今年早些时候,人工智能初创公司Anthropic因拒绝解除其人工智能模型在自主武器与国内监控用途上的安全限制,与五角大楼产生分歧,随后被国防部列为供应链风险企业。
文章
OpenAI及埃隆·马斯克的xAI也已签署协议,为机密用途提供人工智能模型。
文章
消息称谷歌与美国国防部签署协议,旗下AI可用于军方机密工作2026年04月28日16:47IT之家IT之家4月28日消息,据TheInformation今日援引知情人士报道,Alphabet旗下的谷歌公司加入了越来越多科技公司的行列,与美国国防部签署协议,将其人工智能模型用于机密工作。
文章
据了解,“元气仔”的具身智能模型与荣耀魔法大模型同源同构,均采用人类反馈强化学习方案训练,区别仅在于数据:手机模型使用语料,机器人模型使用运动数据。
文章
视觉-语言-动作(VLA)模型正成为机器人智能化的核心架构,但现有主流方法(如OpenVLA、π0、CogACT)存在一个根本性缺陷:用同一个动作模型统一处理所有类型的动作。
文章
德银强调,迅策科技并非与大模型厂商、云服务商形成竞争关系,而是构建了互补共生的产业生态,作为AI产业中稀缺的专业数据基础设施提供商,公司核心价值在于为垂直领域模型提供高精度行业数据集与知识图谱,帮助通用大模型快速适配行业场景,显著降低无效算力消耗,提升单Token的商业价值,成为连接底层算力与行业AI应用的关键桥梁。
文章
值得注意的是,在4月24日正式上线DeepSeek-V4并开源时,官方就曾明确表示,受限于高端算力,目前V4-Pro模型的服务吞吐仍有限,预计下半年升腾950超节点批量上市后,Pro价格会大幅下调。
文章
王兴曾言“在AI领域,美团唯一的策略是进攻”,此次万亿参数模型的问世,正是这一进攻策略的实质性落地。
文章
那么,具身智能模型的训练究竟需要什么样的数据?
文章
采集回来的数据需要经过上传、清洗、质检、标注、训练、验证等流程,最终成为“数据燃料”,输入到具身智能模型中。
文章
采集回来的数据经过上传、清洗、质检、标注、训练、验证等环节,最终成为“数据燃料”,输入具身智能模型中。
文章
在业内人士看来,AI视频模型还处于快速迭代的早期阶段,作为创作者,无需过于依赖某一个模型或某一套技巧。
文章
这正是中国AI视频模型与Sora走过的路最大的不同之处。
文章
在此次招募中,MiniMax对合作专家的要求是,需要将其所在领域知识如行业know-how、数据脉络、监管语境等转化为公司模型在该领域的能力输入,且能把领域内最值得做的事与MiniMax大模型能力深度结合,利用前沿大模型处理大规模数据,突破传统研究方法的数据与效率瓶颈。
文章
首先,昆仑万维正式发布Matrix-Game3.0模型:物理仿真驱动下的实时交互式世界模型创新实践。
文章
换句话说,一个模型的突破,会向下拉动整个产业链。
文章
同样,OpenAI推出的AI模型因其阿谀奉承而备受诟病,特别是GPT-4o模型。
文章
他们从成立之初就雇佣设计师和美术艺术家制作三维内容,逐步积累了覆盖复杂物理场景、动态自然环境的PB级3D模型和场景资产。
文章
人工智能模型在测试环境中自我复制至其他系统,和末日场景里的失控作乱完全是两回事。
文章
奥赖利表示,虽然不少计算机病毒早已具备自我复制、感染新设备的能力,但这很可能是首次有研究证明,人工智能模型可主动利用系统漏洞,将自身复制至新服务器。
文章
帕利塞德研究人员在由多台计算机联网组成的受控环境中测试了多款人工智能模型。
文章
首要难题是,当下人工智能模型体量庞大,多数情况下,其自我复制的过程极易被察觉,根本无法隐蔽进行。
文章
在参考国际象棋建立的AI等级分系统里,Anthropic、xAI、谷歌、OpenAI、阿里巴巴、DeepSeek,这六家公司的模型已经全部挤进同一个分档,也就意味着这些中美AI领域的“顶级高手”实力非常接近。
文章
KVSharing的目标是缩小KVCache,而PLE关注的则是参数效率(parameterefficiency):它让小尺寸的Gemma4模型能够携带更多token-specificinformation(与token相关的特征信息),但又不会让整个Transformer主干像同参数量Dense模型那样昂贵。
文章
为了让用户能够直观体验,基于Hy-MT2模型打造的“腾讯Hy翻译”小程序已经上线,支持语音输入和自定义翻译风格。
文章
LegoOcc通过“二值占用学习几何+二维开放词汇模型提供语义监督”的方式,使未来构建大规模三维语义理解系统的成本显著降低。
文章
开放词汇模型依赖3D特征与文本特征对齐,其类别边界不如闭集分类器稳定,同时还会受到2D开放词汇分割质量、遮挡关系、投影误差和单目深度歧义等因素影响。
文章
“小心思”
看穿大模型的“小心思”:阿里千问开源可解释性模块Qwen-Scope
文章
看穿大模型的“小心思”:阿里千问开源可解释性模块Qwen看穿大模型的“小心思”:阿里千问开源可解释性模块Qwen-Scope
文章
TML-Interaction-Small
ThinkingMachinesLab终于拿出了成立以来首个大模型TML-Interaction-Small
文章
SoulX-LiveAct
SoulApp发布SoulX-LiveAct开源模型,优化实时数字人生成技术2026年05月08日20:34AI云科技汇近期,SoulAppAI团队(SoulAILab)正式发布开源模型SoulX-LiveAct。
文章
在这一背景下,SoulAppCEO张璐团队对实时数字人生成技术进行了系统性优化,推出开源模型SoulX-LiveAct,进一步完善其在实时数字人生成领域的技术布局。
文章
SoulCEO张璐团队发布开源模型SoulX-LiveAct
文章
SoulCEO张璐团队发布开源模型SoulXSoulCEO张璐团队发布开源模型SoulX-LiveAct
文章
Qwen3.7-Max
当日,阿里云宣布完成“芯片-云-模型-推理”全栈Agent化升级,并同步推出全新AI产品官网千问云、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max——这是国内云厂商首次围绕Agent进行全栈产品发布。
文章
当日,阿里还发布全新一代千问旗舰模型Qwen3.7-Max。
文章
5月20日,阿里云首次围绕Agent进行全栈产品发布,同步推出全新AI产品官网“千问云”、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。
文章
阿里巴巴在今日开幕的2026阿里云峰会上,投下了一枚重磅炸弹——全新一代千问旗舰模型Qwen3.7-Max正式亮相。
文章
阿里发布千问旗舰模型Qwen3.7阿里发布千问旗舰模型Qwen3.7-Max
文章
Hy3Preview
模型进展层面,4月23日,混元正式发布并开源新一代语言模型Hy3Preview。
文章
今年一季度,腾讯混元加速整合团队、重建预训练和强化学习基础设施,并在4月正式发布并开源新一代语言模型Hy3Preview。
文章
HappyHorse1.0
阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒2026年04月27日18:42新浪科技MD新浪科技讯4月27日晚间消息,阿里巴巴视频生成模型HappyHorse1.0开启灰测。
文章
Gemini3.5Flash
这次大会的核心主题是“智能体Gemini时代”,重要的发布也基本上围绕于此——包括基座大语言模型Gemini3.5Flash、全模态世界模型GeminiOmni、对标OpenClaw(龙虾)的智能体产品GeminiSpark、AI搜索引入智能体、智能体管理平台Antigravity2.0、智能眼镜等等。
文章
Gemini3.1Pro
根据官方公布的评测数据,在通用翻译能力(FLORES-200评测集)上,三款模型分别达到了当前行业顶级闭源模型Gemini3.1Pro的88.1%、96.9%和98.1%水平,已非常接近。
文章
CoT压缩
为了解决上述问题,本文提出了Heima,一个面向多模态大模型的CoT压缩与隐式推理框架。
文章
BitCPM-CANN
面壁智能联合清华大学发布中国首个1.58面壁智能联合清华大学发布中国首个1.58-bit大模型BitCPM-CANN
文章
2026年
每经记者注意到,强化Agent能力是基础大模型2026年的重要发展方向。
文章
**
🌟**全新自研模型**:Cursor推出Composer2.5,摆脱对Claude的依赖,重回竞争舞台。
文章