登录

模型


描述

模型是当前MTEB榜单上最大规模的Embedding模型之一
文章

在他看来,数据和模型是驱动智能时代的一体两面。
文章

分类

模型

要实现这样的目标,最重要的基础是一个真正强大的多模态模型
文章

谷歌称,Gemini3ProImage是其功能最强大、用途最广泛的图像生成模型
文章

在大模型研究领域,做混合专家模型(MoE)的团队很多,但专注机制可解释性(MechanisticInterpretability)的却寥寥无几——而将二者深度结合,从底层机制理解复杂推理过程的工作,更是凤毛麟角。
文章

DeepSeek星期四(5月29日)晚在官方微信公众号发文称,DeepSeekR1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。
文章

▲Marble可以将生成的世界导出为高斯点云或三角网格模型
文章

KimiK2Thinking模型训练成本仅为460万美元的网络传言喊得响亮,不过,杨植麟已经打假了,他称,这并非官方数据,训练成本很难量化,因为其中很大一部分用于研究和实验。
文章

月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假460万美元、调侃OpenAI2025年11月12日09:03IT之家11月12日报道,昨天凌晨,月之暗面核心团队在社交媒体平台Reddit上举行了一场有问必答(AMA)活动,月之暗面联合创始人兼CEO杨植麟等人在KimiK2Thinking模型发布后不久,正面回应了模型训练成本、跑分与实际体验差距等热点议题。
文章

WorldLabs最新发布的Marble基于生成式3D世界模型技术构建,其最大的特点是使用户能够仅凭一张图片、一段影片或一段文字提示,创建空间连贯、高保真且可持续的三维世界。
文章

公开资料显示,开发出Marble的WorldLabs成立于2024年,其致力于构建能够感知、生成并与3D世界互动的大型世界模型,旨在开发能够执行高级推理并理解对象之间3D空间关系的“空间智能AI系统”。
文章

所谓世界模型,本质是AI系统通过学习现实世界的物理规律、空间关系、因果逻辑等底层规则,构建一套能够模拟、预测甚至生成虚拟或现实世界状态的数字模型
文章

该产品的发布,标志着世界模型从概念正式走向商用。
文章

世界模型的研究将不可避免地推动模型架构与学习算法的革新,尤其是在超越当前MLLM与视频扩散模型范式的方向上。
文章

对于世界模型而言,关键在于构建能够在相似规模上充分利用现有视觉数据的架构。
文章

显然,在通过世界模型彻底释放空间智能之前,我们仍面临着艰巨的挑战。
文章

的早期成果——这是首个能够通过多模态输入进行提示,从而生成并维持一致性三维环境的世界模型
文章

WorldLabs正是在这一信念之上,于2024年初创立:即世界模型的基础方法尚在确立之中,而这正是未来十年人工智能的关键挑战所在。
文章

一是生成性:世界模型能够生成在感知、几何与物理层面保持一致的世界。
文章

三是交互性:世界模型能够根据输入的动作生成下一个世界状态。
文章

为世界模型定义一种像LLM中的「下一token预测」那样简洁优雅的通用任务函数,一直是该领域的核心目标之一。
文章

二是多模态性:世界模型在设计上即是多模态的。
文章

对于空间智能而言,我将「世界模型」定义为具备以下三种核心能力的系统:
文章

尽管仍有大量未知有待探索,但这种目标函数及其对应的表征方式,必须能够反映几何与物理规律,体现世界模型作为联结想象与现实的基础性表征体系的本质特征。
文章

当动作和/或目标成为世界模型的输入提示时,其输出必须包括世界的下一个状态——可以是隐式的,也可以是显式的。
文章

当输入仅包含一个动作,或者包含动作与目标状态时,世界模型应能生成与先前世界状态、预期目标(若有)、语义含义、物理规律及动态行为相一致的输出。
文章

当输入信息不完整时,无论是图像、视频、深度图、文本指令、手势还是动作,世界模型都应能够预测或生成尽可能完整的世界状态。
文章

正如动物与人类一样,世界模型应能够处理多种形式的输入——在生成式AI中通常被称为提示词。
文章

然而,由于世界模型在输入与输出空间上的复杂性,使得这种函数的构建本身极具挑战。
文章

要实现空间智能,我们需要的远不止LLM那样的体系,而是更具雄心的「世界模型」——一种新型生成式模型,能够在语义、物理、几何与动态等多重复杂世界(无论虚拟还是现实)中进行理解、推理、生成与交互。
文章

要解锁空间理解与推理的能力,世界模型必须能够生成属于自己的模拟世界。
文章

要让世界模型具备人类所拥有的那种普适能力,必须突破多个艰巨的技术壁垒。
文章

训练世界模型所需的数据远比文本更为复杂。
文章

除此之外,我认为,除了强大的潜在表征之外,一个通用的世界模型还必须能够生成明确、可观测的世界状态,以适配不同的应用场景。
文章

随着空间智能世界模型在推理与生成能力上的不断增强,可以想见,在某些情况下,模型不仅能预测世界的下一状态,还能基于这一新状态,进一步预测实现目标所需的下一步行动。
文章

」她同时阐述了真正的空间智能世界模型必须实现的核心框架:构建具有故事讲述者想象力的AI、具备第一响应者流畅性的AI以及以科学精确性进行空间推理。
文章

在这篇文章中,我将阐述什么是空间智能、它为何重要,以及我们如何构建能够释放空间智能潜力的世界模型——这种能力将深刻影响创造力、具身智能与人类的未来进步。
文章

世界最大室内哥斯拉模型将亮相日本机场2025年11月11日12:41快科技快科技11月11日消息,据媒体报道,自今年从12月起,世界上最大的室内哥斯拉模型将在日本东京羽田机场亮相。
文章

io)目前只有nanobanana和Seedream等其他AI生图模型
文章

具体来说,研究人员SeanHeelan利用OpenAI的o3模型在Linux核心中发现了一个零日漏洞(zerodayvulnerability)。
文章

但真正能整合上述全部能力的通用世界模型仍处于起步阶段。
文章

借助世界模型,机器将从被动分析转向主动规划和适应。
文章

其团队研发的世界模型可在语义与几何层面理解复杂3D场景,推理其中的物理属性与交互关系,并生成连贯、可探索的虚拟空间,交互中还可遵守物理与几何规律。
文章

李飞飞文中提出,要实现真正的空间智能,就需要突破现有大型语言模型的范式,转向一种更为根本的世界模型
文章

构建世界模型是实现路径
文章

多任务模型快速部署:企业可以为每个业务场景训练一个轻量LoRA,然后用RobustMerge将它们融合成一个全能模型,极大降低服务成本。
文章

未见任务:为了验证合并模型的泛化性能,作者将合并得到的通用模型在4个从未见过的全新任务上进行验证,发现模型平均性能提升4.5%,某些指标甚至超越了联合训练得到的模型,这有力地证明了所提出方法的泛化能力,有助于其在真实世界的使用。
文章

不过,团队也指出,无论是VSI-SUPER基准、VSI-590K数据集,还是Cambrian-S模型和预测性感知机制,都只是这个长期研究方向的初步探索。
文章

在此基础上训练的Cambrian-S模型家族,参数规模从0.5B到7B不等。
文章

在11月8日举行的2025年世界互联网大会乌镇峰会前沿人工智能模型论坛上,平安集团董事会秘书兼品牌总监盛瑞生发表主题演讲,分享了中国平安通过推进“五智”(智能营销、智能服务、智能运营、智能管理,智能经营)战略,全面实施“AIinAll”,以人工智能技术赋能金融服务,践行“金融为民”使命。
文章

KimiK2Thinking模型的核心优势之一是它的Agent能力,能够连续执行200-300次工具调用,无需人工干预即可解决复杂问题。
文章

而更令人震惊的是,媒体援引据一位知情人士透露,KimiK2Thinking模型的训练成本为460万美元,这一数字不到GPT-3训练成本的百分之一。
文章

一、DNA双螺旋模型的提出与分子生物学理论体系的形成
文章

业内普遍认为,KimiK2Thinking极大地缩小了开源模型与闭源模型之间的差距,甚至在多个关键领域实现了反超。
文章

没有人会再质疑——开源模型的“星星之火,可以燎原”。
文章

他强调,当一个开源模型以极低的训练成本达到了最先进模型90%的纸面能力和75%的实际能力时,整个战局有彻底改变的可能。
文章

有美国的科技博主表示,KimiK2为防止美国一些公司继续白剽这些开源模型并套牌说是自己的,出现了比较“奇怪”的modifiedMITLicense,并感叹:
文章

美团发布并开源LongCat-Flash-Omni模型:支持实时音视频交互,达到SOTA水平2025年11月03日10:47IT之家IT之家11月3日消息,9月1日,美团正式发布LongCat-Flash系列模型,现已开源LongCat-Flash-Chat和LongCat-Flash-Thinking两大版本,获得了开发者的关注。
文章

瓦法说,尽管这张乱七八糟的地图会让驾车者抓狂,但人工智能模型已经基本学会在多种情况下从每一个可能的起点出发进行导航的单独规则。
文章

这些研究人员的工作表明,今天的人工智能模型在底层架构上存在某种根本性限制。
文章

而要想真正训练好人工智能模型,需要让它们反复看这些组合。
文章

该实验室负责监管MetaLlama人工智能模型的研发,而这类模型最初正是在FAIR内部开发的。
文章

在这场活动中,最受关注的焦点是KimiK2Thinking模型,这是月之暗面最新发布的开源推理模型
文章

下线两天后,OpenAI暂时恢复了付费用户使用4o模型的权利。
文章

8月初,ChatGPT的开发商OpenAI发布了首个开源模型,名为gpt-oss。
文章

Qwen3-Coder在代码占比70%的7.5T数据上预训练,在后训练阶段进行了编程任务及智能体任务的强化学习,最终实现了通用能力、代码能力及Agent能力的飞升:在浏览器调用(WebArena)、工具调用(BFCL)等Agent能力评测中,Qwen3-Coder刷新开源模型纪录,超越GPT4.1;
文章

千问3编程模型在代码能力及Agent调用能力方面取得重大突破。
文章

央广网北京7月23日消息(记者冀文超)7月23日清晨,阿里开源全新的通义千问AI编程大模型Qwen3-Coder,编程能力登顶全球开源模型阵营,并超越GPT4.1等闭源模型,比肩全球最强的编程模型Claude4。
文章

此外,专家们判断铭文年代的平均误差为31年,而人工智能模型的平均误差仅13年。
文章

除了通过解答数学难题来展示最新的人工智能技术能力,“深层思维”公司还与来自英国、希腊的科研人员合作,开发了生成式人工智能模型“埃涅阿斯”,专门帮助历史学家解读古拉丁铭文的含义和背景。
文章

政策层面,欧盟委员会7月18日发布了通用人工智能模型提供商指南,旨在帮助相关企业履行欧盟《人工智能法案》相关条款在今年8月2日生效后的法律义务。
文章

人工智能模型持续迭代,各种版本的评测数值越来越高,但解决实际问题的能力到底达到什么水平?
文章

华侨银行高管唐纳德·麦克唐纳(DonaldMacDonald)表示:“任何时候,我们都大约有10个开源模型在使用。
文章

在7月份发布的一份AI行动计划中,川普(Trump)政府表示,开源模型“可能在某些商业领域和学术研究中成为全球标准”。
文章

总部位于新加坡的华侨银行(Oversea-ChineseBanking)是东南亚最大的银行之一,该行已基于开源模型开发了约30种内部工具,包括使用谷歌的Gemma来总结文件,使用通义来辅助编写计算机代码,以及使用DeepSeek来分析市场趋势。
文章

然而,杨立昆及其他深度学习专家认为,当前的这些人工智能模型尽管功能强大,但对世界的理解能力有限。
文章

人工智能模型的训练工作也在稳步推进,我今天收到了德米斯(DemisHassabis,Google人工智能公司DeepMindCEO),他表示人工智能模型的预训练与后续优化工作均进展顺利,谷歌Gemini3人工智能模型就充分运用了规模法则,其性能与质量均实现了大幅飞跃,行业正同时迎来多重增长爆发点。
文章

这些应用场景虽各有不同但均在快速发展,且得益于人工智能模型质量的持续提升,它们都能依托英伟达GPU顺畅运行。
文章

据介绍,本次论坛邀请来自政、产、学、研界的全球嘉宾,围绕人工智能模型的安全与治理、技术与生态、应用与产业三大主题展开深度探讨,推动人工智能模型的创新与落地,助力构建更安全、高效和可持续的人工智能发展体系。
文章

DeepSeek也将继续开源新版R1模型,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型
文章

DeepSeek表示,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中,取得当前中国“所有模型中首屈一指的成绩”,在整体表现上已接近OpenAI的o3和谷歌的Gemini-2.5-Pro等美国顶尖模型
文章

文章特别提到,更新后的R1模型对“幻觉”问题(错误或误导性输出)进行了优化,在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45%至50%左右。
文章

OpenAI表示,其开源模型在推理任务上优于同等体量的竞争对手,并以低成本实现了高效运行。
文章

字节推出新AI编程模型
文章

此外,专为要求更高的推理和技术任务设计的GPT-5.1Thinking模型(gpt-5.1)也迎来了重大升级,新版本调整了其在回答前“思考”的时间长度,引入了自适应推理功能:
文章

MiniMaxM2模型本次能力迭代,与极狐驭码平台对于底层模型的核心需求高度契合,我们在第一时间全面测试并顺利适配了MiniMaxM2模型,与MiniMax一起向软件研发智能体的时代更进一步。
文章

极狐驭码全面适配MiniMaxM2模型
文章

近期,MiniMax发布了专为Agent和代码而生的MiniMaxM2模型,体现了顶级代码能力、强大的Agentic表现以及极致性价比和速度。
文章

中国人工智能起步公司深度求索(DeepSeek)发布其热门推理模型R1的首次更新版本,称新版R1模型深度思考能力得到强化,整体表现上已接近美国竞争对手OpenAI和谷歌推出的顶尖模型
文章

DeepSeek使用率暴跌R2模型发布时间一再延迟-信息时代-万维读者网(电脑版)DeepSeek使用率暴跌R2模型发布时间一再延迟
文章

商汤开源SenseNova-SI模型:能理解空间结构,号称多项评测领先GPT-5
文章

商汤开源SenseNova-SI模型:能理解空间结构,号称多项评测领先GPT商汤开源SenseNova-SI模型:能理解空间结构,号称多项评测领先GPT-5
文章

用文字图片等创建3D世界,李飞飞初创公司发布首款商用世界模型|界面新闻·科技用文字图片等创建3D世界,李飞飞初创公司发布首款商用世界模型
文章

直到最近,奥尔特曼突然发现,苗头不对了——他的客户们对包括中国模型在内的开源模型和开放权重模型的使用率显著上升。
文章

”罗毅表示,人工智能模型的精准度依赖于数据的规模和精度,机器化学家系统兼具文献读取、合成、表征、性能测试、机器模型建立和优化等能力,可以全自动完成全流程科研任务,并通过实现高通量数据采集,建立起高质量、全生命周期的数据库,推动原子级制造推动向智能化制造转型。
文章

在准确率、压缩比和搜索成本效率方面,权值回放LTH网络是目前性能最优的对初始网络进行剪枝的模型
文章