生成

这种统一建模方式提升了生成的骨架与表面几何的契合度，为生成高质量的动画资产提供了技术保障。

文章

VASTx清华将蒙皮权重Token化，统一生成骨骼与权重，GRPO微调形变平滑2026-04-2206:30:00

文章

但要让这些模型在游戏或动画中动起来，还需要经过一道复杂的工序——绑定（Rigging），这包含生成骨骼（Skeleton）和绘制蒙皮权重（Skinning）。

文章

这导致生成的骨骼缺乏对表面蒙皮形变的感知，而预测蒙皮时又只能基于固定的骨架去推算。

文章

不过Apple和Replit目前都未解释，Replit是否修改了iPhone上预览AI生成软件的方式，原文也未披露这次审核通过附带了哪些具体条件。

文章

阶跃星辰的胜出，意味着其生成的语音在真实用户反馈中更具“人情味”，在语调自然度与表达感染力上已具备国际顶尖的竞争力。

文章

APPSO第一时间拿到了体验资格，评测榜单的排名能说明结果，但是HappyHorse1.0生成的视频，到底有什么优点，一起来看看我们的实测。

文章

HappyHorse1.0在生成的视频里，则是像一个懂行的摄影指导，各种大师级运镜，从全景到近距离跟拍马蹄的扬尘，再流畅切换到低角度仰拍拔枪的瞬间。

文章

同样一个提示词，丢给多个模型生成的视频画面，可能都会偏向「固定机位」，人物站在中间，缺乏镜头调度。

文章

通过动作和表情，让人物的情绪更有层次感，HappyHorse1.0生成视频也更不容易让人出戏。

文章

不同模态在训练中被动态划分为条件或目标，从而实现全方向生成能力。

文章

其次，通过解耦门控LoRA，模型为不同模态分配独立参数空间，并在对应模态作为生成目标时动态激活，从而有效避免不同模态之间的参数干扰，同时保留预训练扩散模型的原始生成能力。

文章

这种带图思考的能力，正是SenseNovaU1的原生图文理解生成能力。

文章

NEO-unify理解生成统一的全新架构，能够真正让语言和视觉信息协同。

文章

刚刚，我们发现了一款国产开源模型，正好踩中了这个需求——来自商汤的日日新SenseNovaU1系列原生理解生成统一模型。

文章

原生理解生成统一：商汤开源SenseNovaU1，用统一架构终结「缝合怪」多模态2026年04月28日21:27机器之心Pro就在每次大家刚摸熟玩法时，新花样又来了。

文章

相比其他方法存在的伪影与细节丢失，UniVidX生成结果更接近真实分布。

文章

此外，跨模态自注意力机制通过在不同模态之间共享信息，实现了几何、光照与语义层面的统一约束，显著提升了生成结果的一致性与稳定性。

文章

矛盾二（训练层）：解决动态分辨率的信噪比失衡，实现生成稳定性。

文章

也就是说，它并不是单纯“随机画图”，而是能够按照团队既有规范进行设计生成。

文章

例如，部分方法尝试用世界模型生成imaginedtransitions，用于VLA的RLpost-training；

文章

一类方法使用单一生成骨干同时建模未来视觉状态和动作序列，将视频预测与动作生成放进同一个扩散或流匹配过程。

文章

相比完全共享骨干，这种设计保留了不同模态的专门能力，同时让视频预测中的时序和物理先验影响动作生成。

文章

从可控场景生成到空间记忆增强

文章

这种变化在CVPR2026的相关研究中变得更加清晰：自动驾驶方向不再只关注单一感知模块，而是开始围绕可控场景生成、真实感仿真、端到端驾驶对齐和空间检索增强展开。

文章

整体来看，这篇论文把自动驾驶场景生成从“生成一段看起来像驾驶视频的画面”，推进到“可精确编辑轨迹、车辆和3D场景结构的可控仿真”。

文章

它的亮点在于，既保留扩散模型的真实感生成能力，又尽量满足在线仿真的效率要求。

文章

这篇综述的价值在于，它没有把世界模型简单视为视频生成模型在机器人领域的迁移，而是从机器人学习本身出发，重新梳理了世界模型应该承担的功能：辅助策略生成、充当学习模拟器、支持评估与规划、生成训练数据，并最终服务于真实可执行的机器人行为。

文章

智能体生成的内容在法律上如何定性？

文章

签字人是否需要对智能体生成的内容承担全部责任？

文章

研究团队发现，当仅用文本提示时，模型生成的是通用结果；

文章

基于光谱处理的现代OCT技术中，正面切片的生成取决于样本三维体积数据的采集过程—

文章

（LF），该模式将正面切片的生成与完整三维数据采集解耦。

文章

这次升级不是在原有产品形态上叠加新功能，而是同时推进了四个维度的系统性重构：移动端独立App双端上线、原生支持iOS/Android应用生成、企业版正式发布、Agent能力全面扩展并开放自定义Skill接入。

文章

这些批量生成的恶意内容里所有信息都没有可追溯的核实渠道，完全是靠AI拼接出来的虚假内容，却在海外平台获得了大量流量，不少视频的播放量高达数十万次，误导了大量普通网友。

文章

这一进展不仅为视频生成与理解提供了新的技术路径，也为自动驾驶仿真、具身智能、影视制作等领域的实际应用奠定了重要基础。

文章

图1：该图系统性展示了UniVidX在多模态视频生成中的统一建模能力，覆盖Text→X、X→X及Text&X→X三类核心范式。

文章

该工作提出了一个面向多模态视频生成与理解的一体化统一框架UniVidX，在多项视频图形任务上达到或刷新当前最优性能，标志着视频扩散模型在通用化方向上的重要进展。

文章

长期以来，视频图形学与视频生成领域的发展呈现出明显的任务割裂。

文章

可交互三维场景生成的两个长期困境

文章

换句话说，3D场景生成最难的地方，从来不是“生成资产”，而是让空间关系看起来像真实世界，并且真的能够服务于交互、仿真和具身智能任务。

文章

过去几年里，可交互3D场景生成大致沿着两条路线发展。

文章

调查显示，AI起号、AI内容生成的账号花样百出，有母婴类型、颜值类型、宠物类型、甚至还有中老年群体喜欢的养生、情感类型。

文章

但你有没有想过，人们随手用大模型生成的旅行攻略，背后真正支撑的信源，到底来自哪里？

文章

据介绍，KroWork面向非技术用户，通过自然语言即可驱动AI自主完成文件处理、浏览器自动化、应用生成和本地部署。

文章

工程师在整理模型生成的优质数据时，发现这些带有哥布林比喻的回答质量确实高，条理清晰，比喻也算生动；

文章

▲由SenseNovaU1生成

文章

它带来了大模型行业首创的连续图文生成输出，就是用单一模型就能连贯输出图片和文字，这个新鲜很值得去试一试。

文章

在接下来的案例中，SenseNovaU1Lite生成的占星术与塔罗牌占卜图片风格华丽，充满了神秘主义元素，如果你对星座感兴趣，不放也试着做一份属于自己的星座图。

文章

在图像生成基准测试上，SenseNovaU1Lite在信息图生成（Infographics）的其中一项拿到了39.8的高分，领先Qwen-Image等模型。

文章

它不只会生成好看的图片，更是把「信息图生成」带火了：知识卡片、数据图解、攻略长图、科普海报……只要一句话，就能生成一张排版精致、信息清晰、质感在线的图片。

文章

它用更短的时间完成了接近主流商业模型的生成效果，体现出很强的单位时间产出能力。

文章

接下来，我们又让模型生成了一张「柠檬的万能指南」信息图。

文章

接着，我们又换了一个完全不同的题材：让模型生成一张「武侠江湖禁忌」信息图。

文章

首先，我们让模型生成了一张适合可爱女生的短发造型信息图，SenseNovaU1Lite完成度依然在线。

文章

它打破了传统的AI视频生成模型「为了稳妥而选择平庸」的安全构图，用大量扎实的镜头调度，把这段追逐戏的动态张力，原原本本地拍了出来。

文章

回头看HappyHorse1.0的这几个特点，动作不穿帮、镜头有语言感，解决了AI内容质量的可预期性，让我们不用再抱着「抽卡」的心态，去体验AI视频生成。

文章

陈升亮和团队也在筹备一个关于冲浪的电影，继续采用《抵达世界的尽头》尝试出的20%实拍结合80%可灵AI生成的独立电影创作范式，他预计，“90分钟体量，20天制作，5天实拍就够了。

文章

这次入围北影节AIGC单元—最佳长片的《抵达世界的尽头》，是陈升亮和团队的一次“二八定律”实验：20%实拍结合80%的可灵AI生成。

文章

每一个生成的token（标记），都是电子移动、热量管理以及能源转化为计算力的结果。

文章

电影公司在使用AI技术生成虚拟角色时，必须遵循演员的创作意图，确保生成的虚拟角色符合演员的艺术形象。

文章

协议明确规定，演员的数字肖像、声音和表演数据属于演员个人所有，电影公司必须获得演员的书面同意，才能使用其数字形象进行AI合成或虚拟角色生成。

文章

AI带来的薪水和工作条件恶化，演员要求制片方保证不会以AI技术生成的面孔和声音来替代演艺人员，编剧主张尊重编剧署名权和取得报酬权，反对滥用AI编剧带来的剥削压榨。

文章

在未来的研究阶段中，研究人员希望能够进一步提高训练结束后信号生成的稳定性。

文章

同城迁移：浦西生活模式+浦东关键位置生成的轨迹，误差（RMSE）低于0.04。

文章

看懂这条线，很多不确定的就不再不确定了……即传统观念中人机分工往往是静态的蓝图，但实际上，人机协同的本质——边界不是僵化的，而是动态生成的。

文章

其语音生成模型StepAudio2.5TTS凭借出色的听感表现跻身全球前三，成为目前该榜单中排名最高的中国大模型产品。

文章

目前，阶跃星辰已密集发布了StepAudio2.5系列的全链路模型，包括负责语音生成的TTS、主打高精度识别的ASR，以及最新上线的Realtime实时交互模型。

文章

随着3D生成模型的快速发展，生成精美的3D静态模型变得越来越容易。

文章

该工作将连续的蒙皮权重预测转化为“离散Token生成”问题，构建了统一的自回归生成框架TokenRig。

文章

通过豆包生成的手机号，媒体联系上了这位女士，她表示自己从未在网络上公开过手机号，但她确实是豆包用户，遇到不懂的问题也会问豆包，并不清楚在豆包被生成手机号的事情。

文章

若审稿人被认定高度不负责任（如提交AI生成的意见），其自己投稿的论文也可能被直接拒绝。

文章

传统CoT方法会让模型显式生成完整的中间推理文本。

文章

为了实现这一目标，NEO-Unify需要同时解决以下三组主要矛盾，三者呈递进关系：从输入输出接口层的表示统一，到训练稳定性的保障，再到理解与生成参数层的协同。

文章

因此，一个最关键的问题就是：大模型的“思考”是否一定要以人类可读的长文本形式显式得生成出来？

文章

能否让多模态大模型不再生成冗长的显式CoT文本，而是用少量隐式thinkingtokens来完成推理？

文章

同时，在文本驱动生成任务中，模型在视觉质量、语义一致性以及跨模态一致性方面均获得更高评价，且在时间一致性方面显著优于图像级方法。

文章

图3：该图对比了UniVid-Intrinsic与现有方法在Intrinsic生成任务中的表现。

文章

图4：该图展示了UniVidX在Intrinsic生成和RGBA生成任务中的定量评测。

文章

CoT推理的核心思想是让模型在回答问题前先生成中间的推理过程。

文章

阶跃星辰的胜出，意味着其生成的语音在真实用户反馈中更具“人情味”，在语调自然度与表达感染力上已具备国际顶尖的竞争力。

文章

然而，这种“显式思考”也带来了一个越来越突出的效率问题：模型往往需要生成大量的中间推理文本，导致推理token数显著增加，从而带来更高的推理延迟、显存占用和计算成本。

文章

生成模型，到底能不能理解世界，或者说，它们能否促进对世界的理解？

文章