登录

阿里发布HappyHorse 1.1视频生成模型:告别角色变脸、动作卡顿


速读:快科技6月22日消息,阿里巴巴正式推出文生视频大模型HappyHorse 1.1,这是继1.0版本后规模最大的一次全面迭代, 围绕动态表现、主体还原、指令理解、画面质感、音频同步五大维度完成系统性升级。
2026年06月22日 16:09

快科技6月22日消息,阿里巴巴正式推出文生视频大模型HappyHorse 1.1,这是继1.0版本后规模最大的一次全面迭代, 围绕动态表现、主体还原、指令理解、画面质感、音频同步五大维度完成系统性升级,新版本已同步上线HappyHorse官网、阿里云百炼、千问云平台对外开放调用。

基础生成规格与前代保持一致,单次可输出3至15秒短片,原生支持720P、1080P两种高清分辨率, 兼容任意自定义宽高比例,适配短视频、广告片、短剧分镜等多元创作场景。

动态表现力是本次核心优化方向,新版重构运动与时序建模逻辑,改善旧版动作迟缓、动态张力不足问题, 舞蹈、打斗、流体、布料等复杂运动画面连贯度大幅提升,有效缓解行业普遍存在的动作失真、画面拖影缺陷。

主体一致性能力大幅增强,模型支持同时输入9张角色、商品参考图,强化多分镜、多素材融合理解。

生成全程稳定保留人物五官、品牌logo、产品细节, 多人物连续镜头“角色变脸”问题显著减少,适配直播带货、系列广告、连续短剧批量生产需求。

指令遵循能力进一步强化,无论是简短关键词,还是包含多场景、多人物、镜头调度的长段叙事提示词,模型均可精准拆解执行,复杂分镜画面排布更稳定,叙事逻辑更完整。

画质质感完成精细化调校,大幅削弱AI生成常见的油光、过度锐化、虚假磨皮问题,完整保留皮肤毛孔、纹理褶皱等真实细节,人像、实景成片更贴近实拍质感,满足商业广告高清输出标准。

音频生成延续原生音画同步架构,区别于先出画面再后期配音的主流方案,文本、画面、音频统一序列建模,生成过程同步产出匹配口型的原声音频, 支持中、英、日、韩、德、法、阿拉伯7种语言唇形对齐,无需二次调音对齐画面。

底层采用15B参数单流统一Transformer架构,搭配蒸馏去噪优化,推理效率与成本优势突出,单H100显卡即可快速输出1080P成片,适合中小创作者与企业批量商用生产。

【本文结束】如需转载请务必注明出处:

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

OpenAI抢后台,马斯克抢前台

陌陌母公司挚文季报图解:营收24亿净利降19% 唐岩刚获派息超8000万

风口上的AI短剧人,如履薄冰

裁掉5万人 救得了当年“神车”吗?

全球首例!53岁脑死亡男子接受猪肝猪双肾移植

刘强东:未来不需要快递员,一定是机器人送货

唠嗑丨从“有趣灵魂万里挑一”到“赛博恋人一键定制”

脑机接口让“意念成真”

年薪162万元起!马斯克5倍薪资挖角台积电工程师

美国指控EUV光刻机流入中国!ASML强烈否认:每一台都有追踪 地点和用途一清二楚

10年投1万亿研发费威力!华为公布Wi-Fi 7、5G手机专利许可费率 最高近17元/台设备

华为自研 Wi-Fi 7+ 芯片级协同技术支持设备清单更新,MatePad Pro Max 平板确认在册

“床垫界的特斯拉”破产了

雷军再谈1300公里只充一次电争议:言论被断章取义很无奈

雷军回应早餐摆拍被吐槽:当下骂你夸你嘲讽你都有流量 大家笑笑就好

小米徐洁云回应“雷军过早被质疑摆拍”:我们的世界,还是少点阴暗好

雷军首次透露人生中开过最“咸”的玩笑:当年和董明珠打赌本是玩笑,但对方当真了

“床垫界的特斯拉”破产了

南派三叔控诉盗版:新剧上线10分钟就可下载 多家网盘客服回应

小马云要当爸爸了!女友自曝怀孕两个月 还是双胞胎

刘强东:未来不需要快递员,一定是机器人送货

华为官网发布鸿蒙 HarmonyOS 7 (API 26) 新能力一览:空间化设计、新增多形态服务窗口等

梅西上演“帽子戏法” 16球追平世界杯历史射手王纪录

主题:模型