大模型
描述
之前大把国内外AI在洗车问题上翻车,Claude的大模型是少有的能回答对的大模型之一,智商优势明显。
文章
分类
迭代
MiniMax正在持续推进多个大模型的迭代。
文章
调用量
同时,国产大模型的调用量也在持续增长,并在部分领域超越了海外主流模型。
文章
📈国产大模型调用量持续增长,部分领域已超越海外主流模型。
文章
训练
海光双芯“亮剑”:发布“内生安全”技术,冲刺万亿参数大模型训练2026年04月03日16:37电子产品世界4月2日,在海光信息2026年春季技术沟通会上,海光信息正式公开基于“内生安全”理念的一大批新技术、新成果,并首发海光DCU软件栈年度版本,为业界清晰地描绘出海光双芯产品(CPU、DCU)推动国产万亿大模型研发、加速各行各业拥抱“词元经济”的发展蓝图。
文章
光合组织人工智能专委会副主任胡辰表示,本次发布的海光DCU软件栈年度版本坚持围绕三大方向突破和创新,正为国内多个万亿参数顶级大模型的训练提供软硬件耦合支撑。
文章
结构
从团队构成看,肖镇中团队共9人,全部为人工智能方向博士,分别来自剑桥大学、牛津大学及马普所等顶尖高校与科研机构,长期从事大模型结构和训练相关研究,具备扎实的底层技术积累。
文章
竞争
卢言霞认为,当前基础大模型竞争的关键是编程能力、智能体能力等。
文章
潜在空间
大模型潜在空间的研究发展,随大语言模型能力提升分为四个递进阶段,整体从“验证想法”逐步走向“成熟落地、全面爆发”:
文章
大模型的潜在空间,是模型内部通过学习形成的连续非离散的表征空间:在其中编码、处理文字背后的语义、语法、上下文关联等没有直接用文字(token)显式表达的隐含信息;
文章
综上,该综述系统性填补了大模型潜在空间研究的碎片化空白,以“基础—演进—机制—能力—展望”五大视角构建完整研究框架,清晰剖析了潜空间从概念验证到全面爆发的演进路径与底层逻辑。
文章
核心
技术委员会由吴泳铭任组长,三名成员,周靖人、李飞飞、吴泽明分别对应大模型核心技术、云底座基建、全集团业务落地,构成了一条从模型研发到算力基建、推理部署到业务逻辑,最后落脚到商业化变现的完整体系。
文章
未来
到今天还有人在争论,通用大模型和垂类大模型未来是不是只能二选一?
文章
操作系统
张鹏认为,传统操作系统是硬件资源的调度者,而大模型操作系统是智能的调度者。
文章
智谱在财报中提出两个新概念——TAC(TokenArchitectureCapability,Token架构能力)和LLM-OS(大模型操作系统)。
文章
推理过程
他们发现,大模型的推理过程并不是简单的序列生成,而可以从动力学的视角来理解:其本质是隐层状态在高维空间中的连续演化,这一过程承载了模型内部的计算逻辑。
文章
推理
芯方舟敏锐地捕捉到这一变化,致力于算力普惠,创新地采用3D堆叠架构和工艺,把AI算力卸载到数据端,采用传统内存实现大模型推理。
文章
承担
但在别克至境E7上,豆包大模型承担的角色,已经从“执行器”变成了“理解者”。
文章
平台
在确认短期内无法恢复使用后,一部分用户转向豆包、元宝、通义千问等其他大模型平台作为替代。
文章
大模型
MiniMax大模型开发商稀宇科技兑现承诺,于今日正式开源了其在3月发布的Minimax2.7大模型。
文章
前几天Minimax2.7也回应过这个问题,表示低估了准备工作,但计划会在本周开源,今天他们也兑现承诺开源了Minimax2.7大模型。
文章
朱克力指出,中国AI大模型能够稳步发展并实现落地突破,根本上依靠的是完整的数字产业体系、持续的研发投入、丰富的应用场景以及坚持自主可控的发展路径。
文章
MiniMax2.7大模型发布有段时间了,但是一直没有开源的消息,现在官方在Huggingface社区终于透露了具体的计划,对OOS开发者表示歉意,称他们低估了开源所需的工作量,目前还在执行一些基础设施的适配工作,预计本周末发布MiniMax2.7开源。
文章
密集的融资节奏,是资本市场对「端侧大模型」这一方向持续升温的高度认可,也是面壁智能在这一赛道上技术积累与商业落地双线推进的集中体现。
文章
作为聚焦端侧智能的大模型企业,面壁智能从「密度法则」的科学化理论、架构创新,到MiniCPM端侧大模型与高效工具链研发,再到在汽车、手机、智能家居等终端领域规模化落地,面壁智能已逐步形成「理论-模型-工具-应用」的全链路技术生态闭环与产业向心力,持续加速端侧智能的商业化进程。
文章
一句话卖点:具身智能大模型先行者,自研模型全球领先
文章
丨自变量机器人・A++轮・通用具身智能大模型
文章
4月2日报道,火山引擎总裁谭待正式披露了豆包大模型的最新“战报”:其日均Token使用量已强势突破120万亿大关。
文章
中国大模型调用量的持续领先,反映出国内AI产业已从单纯的技术追赶进入到大规模应用爆发期。
文章
在全球模型调用量排行榜上,中国大模型展现了统治级的优势,直接包揽了前六位席位:
文章
随着阿里、小米、阶跃星辰等厂商持续迭代,中国大模型有望在更多垂直领域释放潜能,为全球数字经济注入源自东方的强劲动力。
文章
MiniMax2.7大模型在3月18日发布,距离春节前夕发布MiniMax2.5只过了一个月多点时间,迭代速度非常快,号称是稀宇科技第一个模型深度参与迭代自己的模型。
文章
一方面当然是因为中国大模型越来越好用,另一方面,是因为成本,简单来说就是,中国电力优势正在转换为算力优势,让词元——Token的定价,远低于国外。
文章
媒体说,过去一年,中国大模型的海外付费调用量呈现爆发式增长,今年,这个趋势更快。
文章
正如同中国制造一样,中国大模型也有自己的独特优势,比如,它进化快,它成本低。
文章
目前,顶尖中国大模型的海外调用量正在成倍增长。
文章
第二,海外付费调用量,指的是海外个人、企业充值来使用中国大模型生产的Token。
文章
而就在3月16日,中国大模型厂商月之暗面,也就是发布了Kimi的公司,发布了一份名为《注意力残差》的技术报告,从底层逻辑的层面,对Transformer架构的关键组件残差连接进行了其发布十年来的首次重大重构。
文章
试想一下,当中国大模型通过性价比更高的Token,服务全世界的用户时,它的成长速度一定会硅谷的同行,这一东升西落的趋势是不可逆的,且会逐渐加速的。
文章
这个数据,简单来说,就是世界上花钱使用中国大模型的人数正在变多。
文章
2025年11月,王兴兴曾公开表示,当前人形机器人(包括具身智能)最关键的技术瓶颈仍在于机器人大模型(具身大模型)的进展速度。
文章
4月,千里科技也推出了首个舱驾融合的大模型;
文章
最让人关心的还是Gemma4大模型的能力,当前的Gemma3算是轻量级的,最大参数量也就27B,可以用单卡GPU运行,也支持多模态能力,能力当然没法跟谷歌主力大模型相比,但在开源社区口碑还是不错的。
文章
另一方面,提供更硬核的科研基座支撑,随着DeepLink超智融合算力平台、Sciverse科学智能数据库等基础设施的建成,以及“书生”科学大模型、科学发现平台的持续迭代提升,将为科研工作提供更强大、更易用的全链路技术资源。
文章
今年3月,阿里内部已将AI的总称和核心品牌统一为“千问”,千问大模型(Qwen)涵盖基础大模型和专业领域模型,千问App是阿里巴巴在C端(面向消费者)的旗舰AI应用。
文章
此外,随着千问AI眼镜正式接入阿里生态,阿里的C端AI打法也越发清晰:以千问大模型为核心底座,串联起千问App这一旗舰应用与千问AI眼镜这一穿戴硬件终端,同时整合阿里生态内电商、出行、生活服务等核心资源,试图让C端AI布局更具协同性和竞争力。
文章
谷歌发布Gemma4大模型:31B登顶开源第三!
文章
“磐石·禹衡”大模型旨在破解传统碳核算知识壁垒高、数据更新慢、分辨率低等瓶颈,构建了坚实的底层支撑体系:
文章
“磐石·禹衡”大模型的初步运行结果,正显著提升中国在全球气候治理中的科技话语权:
文章
中国AI大模型连续五周力压美国,包揽榜单前六2026-04-0709:35·
文章
全球首个全景式碳排放核算系统大模型在沪发布全球首个全景式碳排放核算系统大模型在沪发布_东方财富网
文章
中国发布“磐石·禹衡”碳核算大模型:精准刻画全球“碳足迹”2026-04-0817:43·
文章
据报道,由中国科学院上海高等研究院牵头打造的全球首个全景式碳排放核算系统——“磐石·禹衡碳核算大模型”在上海正式发布。
文章
字节跳动豆包大模型成“流量王”:两年狂涨1000倍2026-04-0210:32·
文章
在别克至境E7上
正如豆包大模型在别克至境E7上的落地,被拆解为陪伴、出行、娱乐、用车、车控五个维度,但真正的变化不在于功能数量,而在于这些功能与家庭用车场景的融合。
文章
厂商
相关技术已成功支撑大模型厂商生产级集群部署,芯片算力利用率(MFU)达到行业前列水平。
文章
另一方面,独立大模型厂商在生产或提供Token时,同样需要依赖云厂商提供的大量算力支持。
文章
因此,腾讯云的Agent既可以基于自研混元模型,也可以调用其他主流大模型厂商的能力,这些都会成为其收入来源。
文章
内部
然而,核心难题在于:如何捕捉大模型内部高维、复杂的非线性动力学?
文章
简而言之,DSD是对大模型内部“思维多样性”的量化:它不仅反映了内部计算的复杂性,也为探索-利用的策略优化提供了明确方向。
文章
公司
他进一步分析称,视觉领域的需求具有高度主观性,单一模型无法满足所有用户的个性化诉求,而大模型公司受限于商业模式也不会选择深入所有的垂直场景做精细化布局。
文章
而且,垂直领域的很多数据并非大模型公司能轻易获取,比如我们推出AI整牙功能之前,有专门花钱购买或拍摄整牙前后的数据。
文章
这种深耕垂直的投入,我认为与大模型公司的商业模式并不匹配,所以判断他们不会做这类精细化投入。
文章
大模型公司的主要商业模式是卖Token,但目前收入其实很少,OpenClaw出现之后,大模型公司卖Token的收入可能翻了几个量级。
文章
我估计现在全球有几十万人在日以继夜地给OpenClaw发版本,这个进化速度快得超乎想象,它让大模型公司的Token卖得更好,间接地也让芯片厂商的芯片卖得更好,整个AI行业会因为OpenClaw而更加繁荣。
文章
从收入规模上看,智谱已成为国内收入体量最大的大模型公司。
文章
企业
在“养虾”热带动下,大模型企业和云厂商的访问量和Token使用量持续上涨。
文章
价格
当年5月,字节跳动以0.0008元/千tokens的价格掀起大模型价格战,随后阿里云跟进,宣布通义千问最高降价97%,彼时通义千问GPT-4级主力模型Qwen-Long输入价格从0.02元/千tokens降至0.0005元/千tokens。
文章
价值
比如同样是拍照批改功能,通用大模型的效果能达到80分,这个水平确实已经很高了,但教育大模型的效果能达到90分,而且推理成本只有通用大模型的几分之一,教育大模型的价值是显而易见的。
文章
产品
事业部
与此同时,阿里还将通义实验室升级为通义大模型事业部,由周靖人负责;
文章
阿里此次调整的重点便是顺应体系化会战的转向,其战略意图从集团技术委员会和升级通义实验室为通义大模型事业部可以得到印证。
文章
为主
按照上述财务数据的收入比重,尽管智谱建立了MaaS平台相关的增长能力,但智谱2025年的收入依然以本地化部署和企业级通用大模型为主。
文章
“智肾”
针对这一困境,由南方医院肾内科侯凡凡院士团队牵头,联合国内顶尖肾病专家与AI技术团队,基于满血版DeepSeek大语言模型和国产信创环境,研发出我国首个慢性肾脏病综合管理大模型“智肾”。
文章
Token调用量
随着AI大模型的普及,国产大模型的Token调用量也领跑全球。
文章
Token消耗
火山引擎总裁谭待使得用户在个人生产力提升和复杂任务处理方面的AI使用需求增加
文章
2026年
IDC(国际数据公司)中国研究总监卢言霞向《每日经济新闻》记者表示,强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。
文章
强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。
文章
强化Agent能力,为何成为国产基础大模型2026年重要发展方向?
文章
2025年
企业级通用大模型2025年营收3.6亿元,同比增长70.5%,占收入总额50.4%;
文章
事件
2026-05-00
当年5月,字节跳动以0.0008元/千 tokens的价格掀起大模型价格战,随后阿里云跟进,宣布通义千问最高降价97%
文章
2026-04-08
4月8日,由中国科学院上海高等研究院(以下简称上海高研院)牵头打造的“磐石–禹衡碳核算大模型”(以下简称禹衡大模型)在沪发布
文章
磐石 · 禹衡碳核算大模型”1.0 版今天在上海发布
文章
2026-04-07
在众多大模型中DeepSeek V4可以说让大家望穿秋水,目前的预期是本月发布,前几天的几次系统崩溃更让人相信会有升级,今晚又被人发现新的灰度测试
文章
快科技4月7日消息,在众多大模型中DeepSeek V4可以说让大家望穿秋水,目前的预期是本月发布
文章
2025-03-02
当前的Gemma 3大模型是去年3月份发布的
文章