大模型
分类
调用量
同时,国产大模型的调用量也在持续增长,并在部分领域超越了海外主流模型。
文章
📈国产大模型调用量持续增长,部分领域已超越海外主流模型。
文章
训练
海光双芯“亮剑”:发布“内生安全”技术,冲刺万亿参数大模型训练2026年04月03日16:37电子产品世界4月2日,在海光信息2026年春季技术沟通会上,海光信息正式公开基于“内生安全”理念的一大批新技术、新成果,并首发海光DCU软件栈年度版本,为业界清晰地描绘出海光双芯产品(CPU、DCU)推动国产万亿大模型研发、加速各行各业拥抱“词元经济”的发展蓝图。
文章
光合组织人工智能专委会副主任胡辰表示,本次发布的海光DCU软件栈年度版本坚持围绕三大方向突破和创新,正为国内多个万亿参数顶级大模型的训练提供软硬件耦合支撑。
文章
未来
到今天还有人在争论,通用大模型和垂类大模型未来是不是只能二选一?
文章
操作系统
张鹏认为,传统操作系统是硬件资源的调度者,而大模型操作系统是智能的调度者。
文章
智谱在财报中提出两个新概念——TAC(TokenArchitectureCapability,Token架构能力)和LLM-OS(大模型操作系统)。
文章
推理过程
他们发现,大模型的推理过程并不是简单的序列生成,而可以从动力学的视角来理解:其本质是隐层状态在高维空间中的连续演化,这一过程承载了模型内部的计算逻辑。
文章
平台
在确认短期内无法恢复使用后,一部分用户转向豆包、元宝、通义千问等其他大模型平台作为替代。
文章
大模型
一句话卖点:具身智能大模型先行者,自研模型全球领先
文章
丨自变量机器人・A++轮・通用具身智能大模型
文章
4月2日报道,火山引擎总裁谭待正式披露了豆包大模型的最新“战报”:其日均Token使用量已强势突破120万亿大关。
文章
张益民提出具身智能有四大核心方向待突破:具身智能大模型与世界模型研发、端侧实时推理优化、机器人本体升级以及云边端融合及人机协同。
文章
一方面当然是因为中国大模型越来越好用,另一方面,是因为成本,简单来说就是,中国电力优势正在转换为算力优势,让词元——Token的定价,远低于国外。
文章
媒体说,过去一年,中国大模型的海外付费调用量呈现爆发式增长,今年,这个趋势更快。
文章
正如同中国制造一样,中国大模型也有自己的独特优势,比如,它进化快,它成本低。
文章
目前,顶尖中国大模型的海外调用量正在成倍增长。
文章
第二,海外付费调用量,指的是海外个人、企业充值来使用中国大模型生产的Token。
文章
而就在3月16日,中国大模型厂商月之暗面,也就是发布了Kimi的公司,发布了一份名为《注意力残差》的技术报告,从底层逻辑的层面,对Transformer架构的关键组件残差连接进行了其发布十年来的首次重大重构。
文章
试想一下,当中国大模型通过性价比更高的Token,服务全世界的用户时,它的成长速度一定会硅谷的同行,这一东升西落的趋势是不可逆的,且会逐渐加速的。
文章
这个数据,简单来说,就是世界上花钱使用中国大模型的人数正在变多。
文章
2025年11月,王兴兴曾公开表示,当前人形机器人(包括具身智能)最关键的技术瓶颈仍在于机器人大模型(具身大模型)的进展速度。
文章
最让人关心的还是Gemma4大模型的能力,当前的Gemma3算是轻量级的,最大参数量也就27B,可以用单卡GPU运行,也支持多模态能力,能力当然没法跟谷歌主力大模型相比,但在开源社区口碑还是不错的。
文章
AI赛道将从基础大模型,转向AI在细分行业的应用落地,具身智能的重点将从本体、运动控制,到具身智能大模型。
文章
今年3月,阿里内部已将AI的总称和核心品牌统一为“千问”,千问大模型(Qwen)涵盖基础大模型和专业领域模型,千问App是阿里巴巴在C端(面向消费者)的旗舰AI应用。
文章
此外,随着千问AI眼镜正式接入阿里生态,阿里的C端AI打法也越发清晰:以千问大模型为核心底座,串联起千问App这一旗舰应用与千问AI眼镜这一穿戴硬件终端,同时整合阿里生态内电商、出行、生活服务等核心资源,试图让C端AI布局更具协同性和竞争力。
文章
谷歌发布Gemma4大模型:31B登顶开源第三!
文章
字节跳动豆包大模型成“流量王”:两年狂涨1000倍2026-04-0210:32·
文章
厂商
相关技术已成功支撑大模型厂商生产级集群部署,芯片算力利用率(MFU)达到行业前列水平。
文章
另一方面,独立大模型厂商在生产或提供Token时,同样需要依赖云厂商提供的大量算力支持。
文章
因此,腾讯云的Agent既可以基于自研混元模型,也可以调用其他主流大模型厂商的能力,这些都会成为其收入来源。
文章
内部
然而,核心难题在于:如何捕捉大模型内部高维、复杂的非线性动力学?
文章
简而言之,DSD是对大模型内部“思维多样性”的量化:它不仅反映了内部计算的复杂性,也为探索-利用的策略优化提供了明确方向。
文章
公司
他进一步分析称,视觉领域的需求具有高度主观性,单一模型无法满足所有用户的个性化诉求,而大模型公司受限于商业模式也不会选择深入所有的垂直场景做精细化布局。
文章
而且,垂直领域的很多数据并非大模型公司能轻易获取,比如我们推出AI整牙功能之前,有专门花钱购买或拍摄整牙前后的数据。
文章
这种深耕垂直的投入,我认为与大模型公司的商业模式并不匹配,所以判断他们不会做这类精细化投入。
文章
大模型公司的主要商业模式是卖Token,但目前收入其实很少,OpenClaw出现之后,大模型公司卖Token的收入可能翻了几个量级。
文章
我估计现在全球有几十万人在日以继夜地给OpenClaw发版本,这个进化速度快得超乎想象,它让大模型公司的Token卖得更好,间接地也让芯片厂商的芯片卖得更好,整个AI行业会因为OpenClaw而更加繁荣。
文章
而数据暴增除了刺激已经上市的两家大模型公司的股价,未上市企业的估值也节节攀升。
文章
从收入规模上看,智谱已成为国内收入体量最大的大模型公司。
文章
价格
当年5月,字节跳动以0.0008元/千tokens的价格掀起大模型价格战,随后阿里云跟进,宣布通义千问最高降价97%,彼时通义千问GPT-4级主力模型Qwen-Long输入价格从0.02元/千tokens降至0.0005元/千tokens。
文章
价值
比如同样是拍照批改功能,通用大模型的效果能达到80分,这个水平确实已经很高了,但教育大模型的效果能达到90分,而且推理成本只有通用大模型的几分之一,教育大模型的价值是显而易见的。
文章
为主
按照上述财务数据的收入比重,尽管智谱建立了MaaS平台相关的增长能力,但智谱2025年的收入依然以本地化部署和企业级通用大模型为主。
文章
MiniMaxM2.5
国产大模型MiniMaxM2.5已经连续五周霸榜全球大模型调用量冠军,MiniMax创始人、首席执行官闫俊杰在业绩交流会上披露,2026年2月公司ARR(AnnualRecurringRevenue,年度经常性收入)超过1.5亿美元。
文章
2025年
企业级通用大模型2025年营收3.6亿元,同比增长70.5%,占收入总额50.4%;
文章
事件
2026-05-00
当年5月,字节跳动以0.0008元/千 tokens的价格掀起大模型价格战,随后阿里云跟进,宣布通义千问最高降价97%
文章
2025-03-02
当前的Gemma 3大模型是去年3月份发布的
文章
效果
公司推出的大模型专项加速工具包搭载无损量化技术,在完全保留模型精度的前提下实现全流程性能跃升,长文本处理效率提升50%以上,系统算力利用率提升60%以上,集群通信开销降低30%以上,可全面适配大模型前沿技术范式,显著降低部署成本。
文章
企业用户通过API接口调用大模型能力,按调用量或订阅方式计费,降低使用门槛和前期投入。
文章
随着大模型能力持续提升,系统负载也在同步增加。
文章
影响
它可以常驻、不断地运行,它可以轻松切换接入不同的大模型,它有强大的记忆系统,它可以定时发起任务,它可以操作用户的本地设备……总之,它离真正的AI智能助手又近了一大步,当然运行过程中也就消耗了更多的Token。
文章
在“龙虾热”带动的全产业链红利中,国产大模型企业成为最直接、最核心的受益者。
文章
“AI医院的建设要分阶段,一定是先各自探索、协同聚焦,然后形成分层次、分领域的、有影响力的AI大模型,这些大模型能够到所有医疗机构(发挥作用)。
文章
其它
多家医院推出大模型、智能体,可聚焦专科、辅助基层,AI医院离我们还有多远?
文章
其它
到今天还有人在争论,通用大模型和垂类大模型未来是不是只能二选一?
文章
其它
那么,它们和当前市面上的通用医疗类大模型有什么区别?
文章
其它
多家医院推出大模型、智能体,可聚焦专科、辅助基层,AI医院离我们还有多远?
文章
其它