登录

网易有道“子曰4”多模态模型、语音合成模型全量开源


速读:而开源的语音合成(TTS)模型支持跨语种音色情感迁移克隆,只要上传一段中文音频,就能克隆说话人的音色,并流利说出英语、韩语、越南语……不带“中式口音”。
2026年05月22日 17:45

IT之家 5 月 22 日消息,网易有道今日宣布,决定将“子曰”大模型 4.0 的核心双引擎 ——“多模态模型”与“语音合成(TTS)模型”, 正式面向全球全量开源 。开发者可以免费下载、部署,并基于此进行二次开发。

此次开源的“子曰 4”多模态模型(27B 参数规模)面向教育场景,支持视觉输入的数理能力,做到了行业顶尖水平(SOTA)。

此外,新模型采用了精细化思维链重构方案。通过汇聚大规模优质、精简的推理样本进行深度优化,把思维链输出长度压缩了 43.2%。这意味着:回答同样的问题, 它输出的 Token 更少、推理路径更短、出答案更快 。

对于做实际业务的开发者和企业来说,直接效果就是: 推理成本 下降 。

此外,网易有道团队还针对国内学生 真实的作业、考试和提问场景 进行了深度优化,让它能够解决真实学习中遇到的复杂痛点。

而开源的语音合成(TTS)模型支持 跨语种音色情感迁移克隆 ,只要上传一段中文音频,就能克隆说话人的音色,并流利说出英语、韩语、越南语…… 不带“中式口音”。而且情感也能精准迁移克隆 —— 只要生气地说一句话,合成出来的外语也是生气的语气。

关键词 :

网易有道 语音合成 推理

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?

微信封禁自家“兄弟”红包,打的什么牌?

华住,比携程还会捞金?

雷军强烈建议大家现在就换手机:内存成本持续上涨 未来两年还会越来越贵

官方揭秘!为啥AI总会一本正经地胡说八道:普通人2招就能解决

39万!雷军发布小米最贵SUV

终于等到这一天!黄仁勋亲口承认 华为成功替代NVIDIA:CUDA再见了

等了半天Ultra 为啥小米搞了个YU7 GT

微软承认在 Word、Excel 和 PowerPoint 中加入 Copilot 悬浮按钮是个错误,遭大量投诉后回调

国内充电桩规模再创新高 总数逼近2200万个

网传一只鹿角天牛价值58万 昆虫学家:荒唐的炒作!

美国连DUV都要禁卖!ASML CEO:越限制中国越加速自研、这是存亡问题

2nm芯片+7.6寸大屏!第四家阔折叠要来了:博主暗示将会是荣耀

南美足联呼吁下届世界杯扩至66队:世界杯应更具包容性

真国产豪车!李斌:一季度蔚来成交均价比宝马高5万元 是奥迪1.5倍

何小鹏:激光雷达是个好东西 但汽车已不需要它了

张雪夺冠赛车复刻版交车完成!张雪:赛季末将拍卖德比斯驾驶的53号真车和奖杯 捐给韩红基金

6G网要来了!中国率先布局 2030年或将正式迈入商用阶段

网传一只鹿角天牛价值58万 昆虫学家:荒唐的炒作!

最讨厌说假话!张雪直播识破车主撒谎当场宣布:拉黑并取消福利

雷军强烈建议大家现在就换手机:内存成本持续上涨 未来两年还会越来越贵

被判赔3家车企共226万元 汽车博主回应:没收任何黑心钱

39万!雷军发布小米最贵SUV

主题:模型|语音合成|多模态模型