登录

阿里千问发布全模态大模型Qwen 3.5-Omni,无缝理解文本、图片、音频及音视频输入


速读:阿里千问今晚发布全模态大模型 Qwen3.5-Omni。 其中,通用音频理解、推理、识别、翻译、对话全面超越Gemini-3.1Pro,音视频理解能力总体达到Gemini-3.1Pro水平。
2026年03月30日 22:04

IT之家 3 月 30 日消息,阿里千问今晚发布全模态大模型 Qwen3.5-Omni。

IT之家附核心亮点如下:

视频创作与剪辑

根据音视频指令,生成网页内容

更像真人的实时对话

专属音色克隆

智能任务执行

相比上一代,Qwen3.5-Omni 在 长上下文、多语言、音视频理解能力 上都有明显提升,同时新增了语义打断、音色克隆、语音控制等实时交互能力,让对话体验更接近真人。配合 ARIA 技术,语音输出的稳定性和自然度也进一步改善。

Qwen3.5-Omni-Plus 在音频 / 音视频的理解、推理和交互任务上,共取得 215 项 SOTA 成绩,涵盖音视频、音频、语音识别、语音翻译等多个方向。

其中,通用音频理解、推理、识别、翻译、对话全面 超越 Gemini-3.1 Pro ,音视频理解能力总体达到 Gemini-3.1 Pro 水平。同时,视觉和文本能力与同尺寸 Qwen3.5 模型持平。

用户可以通过阿里云百炼 搜索 Qwen3.5-Omni 调用 API,提供了 Plus、Flash、Light 三种尺寸,满足不同场景需求。

关键词 :

阿里

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?

微信封禁自家“兄弟”红包,打的什么牌?

华住,比携程还会捞金?

重大事故!DeepSeek瘫痪超过8小时

古尔曼对苹果首款折叠屏手机 iPhone Fold 寄予厚望,称其是“iPhone 史上最重大改款机型”

真基建狂魔!我国将在长江水下开高铁:最强盾构机入场 无人操控厘米级精准控向

研究:AI 普及后职场工作量不减反增,周末加班与工作碎片化加剧

内存厂暴跌上百亿 结果只是一个乌龙?

微软承诺改进 Win11 系统受控功能推送(CFR),赋予用户更大选择权

Deepseek崩了上热搜 暂未恢复正常

家电为什么越来越难回到过去的价格?

绝地反超!张雪机车“生吃”两台雅马哈R9和杜卡迪V2:再夺一冠

AI越普及工作越忙 职场人周末加班涨幅超40%

DeepSeek 服务出现重大中断,网页与 App 均受影响

绝地反超!张雪机车“生吃”两台雅马哈R9和杜卡迪V2:再夺一冠

油价再这么涨下去 恐怕全世界都要买电车了

重大事故!DeepSeek瘫痪超过8小时

古尔曼对苹果首款折叠屏手机 iPhone Fold 寄予厚望,称其是“iPhone 史上最重大改款机型”

vivo X300 Ultra评测:没带长枪短炮也能拍出专业电影视频

零跑 D19 豪华旗舰 SUV 上市定档:4 月 16 日见

全球增程车型第一!零跑D19将于4月16日上市:预计售价25-30万元

替代三星、SK海力士!苹果拟牵手长江存储:中国销售iPhone或搭载国产闪存芯片

配可升降激光雷达 莲花FOR ME插混高性能SUV上市:50.8万元起

主题:Qwen3.5-Omni|阿里