阿里通义Qwen3-TTS模型家族上新：声音不仅能复制，还可以定制

IT之家 12 月 24 日消息，阿里通义今日官宣，Qwen3-TTS 家族新推出两款模型，音色创造模型 Qwen3-TTS-VD-Flash和音色克隆模型Qwen3-TTS-VC-Flash。IT之家附模型主要特点如下：

音色创造：Qwen3-TTS-VD-Flash 支持复杂自然语言指令输入，实现对音色、韵律、情感、人设等的精细化调控，实现从“说什么”到“如何说”的全面掌控，可以让用户自由地定义想要的音色，彻底摆脱只能进行根据已有的音色进行克隆或者只能选择固定的一部分预设音色。在 InstructTTS-Eval 中综合表现显著优于 GPT-4o-mini-tts、Mimo-audio-7b-instruct，在角色扮演测试中也超越 Gemini-2.5-pro-preview-tts。
音色克隆：Qwen3-TTS-VC-Flash 支持 3s 级别音色克隆，并且可以基于克隆的音色生成中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语等 10 大主流语言。在 MiniMax TTS Multilingual Test Set 上，平均词错误率（WER）全面优于 MiniMax、ElevenLabs 及 GPT-4o-Audio-Preview。
高表现力：Qwen3-TTS-VD-Flash 和 Qwen3-TTS-VC-Flash 具备高表现力的拟人化音色，能够稳定、可靠地输出高度契合输入文本的语音内容，并根据文本语义自动调节语气节奏，呈现自然生动的表达效果。
鲁棒的文本能力：Qwen3-TTS-VD-Flash 和 Qwen3-TTS-VC-Flash 具备强大的文本解析能力，可自动处理复杂文本结构，精准提取关键信息，对多样化、非规范化的文本格式展现出较强的鲁棒性（IT之家注：robustness，系统在面临内部结构或外部环境的改变时维持功能稳定运行的能力）。

Qwen3-TTS-VD-Flash

Qwen3-TTS 支持通过自然语言描述生成定制化的音色形象。用户可以随意输入声学属性、人设描述、背景信息等自由描述，轻松创造出自己期望的声音形象。

可控生成：在 InstructTTS-Eval 中，Qwen3-TTS 综合表现显著优于 GPT-4o-mini-tts、Mimo-audio-7b-instruct，在角色扮演测试中也超越
Gemini-2.5-pro-preview-tts。

Qwen3-TTS-VC-Flash

Qwen3-TTS 支持通过自然 3s 级别音色克隆，并且可以基于克隆的音色生成多语种音频，同时对复杂文本和野生音频都有较高的鲁棒性。

多语种音色克隆：在 MiniMax TTS Multilingual Test Set 上，Qwen3-TTS 在中、英、法、意大利等语项的内容稳定性优于 MiniMax、ElevenLabs 及 GPT-4o-Audio-Preview；其平均词错误率（WER）位居第一。

Qwen3-TTS-Voice-Design API 文档：

展开阅读全文

更新时间：2025-12-25

标签：科技阿里模型声音家族音色文本错误率自然语言表现力能力角色扮演葡萄牙语语种

1 2 3 4 5

阿里通义Qwen3-TTS模型家族上新：声音不仅能复制，还可以定制

Qwen3-TTS-VD-Flash

Qwen3-TTS-VC-Flash

第十九次李四光地质科学奖在京颁奖

Minimax M2.1 实测，Coding 多语言能力迎来重大突破

联合国国际全民健康覆盖日十周年公益庆典在沪举办

两年前猛裁1.2万人后，谷歌吃起了“回头草”：新招的AI工程师中，20%是「老面孔」

陈润生：人工智能将为人类生产生活带来重大效益

长城快评 | 收费、捐款这些事，就不劳家委会费心了

在培养皿中重现“自闭症大脑”：科学家破解脑过度生长之谜

家长的钱包终于“有谱”了

科研赋能幼教发展，越西县幼儿园省级课题开题

“儿子都腺样体了，还给他吃烤肠”，廉价早餐出卖不负责的父母

家里大宝得了水痘，8个月的小宝能不能带去打水痘疫苗预防一下啊？

美国人口不到3.5亿，俄不到1.5亿，为何中国14亿人还担忧人口问题

家门口享受托育服务——江西南昌红谷滩构建普惠托育服务体系

“医”图读懂｜@女性朋友：常见的宫寒，到底怎么办？

4种行为被列入“伤宫清单”可信吗？想护子宫，这3件事最好少做

Minimax M2.1 实测，Coding 多语言能力迎来重大突破

千问语音合成模型Qwen3-TTS 发布，支持3秒克隆音色和音

轴体内置声音包，TTC推出全新磁轴：马轴

话筒点亮星河——第3届“金声奖”颁奖典礼礼赞声音里

光帆科技全球首款具备视觉感知能力的主动式AI耳机正式

2026年科技主线全局，不看会错过

川企观想科技出手，拟收购辽宁这家“小巨人”企业

科技板块普涨背后：分化加剧，谁在引领真行情？

洁美科技(002859.SZ)：公司HVLP铜箔已经给韩国斗山送样，

中华经典诵读大会河北站精彩展演丨董丽娜携《心田上的