Qwen3-TTS family is now open sourced: Voice design, clone, and generation
产品/方法概述
- 一句话介绍: Qwen3-TTS 是阿里开源的新一代语音合成大模型,支持语音设计、克隆及高质量音频生成。
- 核心问题: 解决了现有TTS模型在情感表现力、多语言克隆质量、以及在低算力环境下实现高质量拟人化配音的瓶颈。
- 实现方式: 基于Qwen大模型底座,提供不同参数规模的模型(如0.6B),通过音频参考实现少样本克隆,并支持通过提示词控制语音风格。