参考:
https://modelscope.cn/models/Qwen/Qwen3-TTS-12Hz-1.7B-Base
https://github.com/QwenLM/Qwen3-TTS
https://www.bilibili.com/video/BV1jXf2B6EQp/?spm_id_from=333.1387.homepage.video_card.click
https://blog.csdn.net/tanking66/article/details/141888300

后端

以WSL为例一切都在一个虚拟环境中运行,推荐python3.12.x

拉取官方仓库

1
git clone https://github.com/QwenLM/Qwen3-TTS.git

接着进入仓库文件夹,在里面执行pip install -e .

1
2
cd Qwen3-TTS
pip install -e .

pip install -e .会自动下载、配置当前目录中pyproject.tomlsetup.py文件中指定的资源,运行后,名为qwen-tts的指令将存在于当前虚拟环境,并且如果当前目录下的文件有所改变,指令qwen-tts也会跟着改变

安装torch

1
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu126

这里版本选择的是CUDA 12.6

使用 FlashAttention 2 以减少 GPU 显存占用(Windows跳过)

安装CUDA Toolkit

刚刚我们所安装的pytorch的CUDA版本为12.6,为保证版本一致,这里CUDA Toolkit也使用12.6版本
可以参考CUDA Toolkit官网
这里以Ubuntu22.04LST的WSL版本为例,使用deb(network)方法,最省事

  1. 获取.deb文件,可以理解为安装凭证,有了它才能下载nvidia的东西
    1
    wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
  2. 安装deb文件
    1
    sudo dpkg -i cuda-keyring_1.1-1_all.deb
  3. 更新apt-get并安装CUDA-Toolkit
    1
    2
    sudo apt-get update
    sudo apt-get -y install cuda-toolkit-13-2
  4. 添加环境变量
    进入.bashrc初始文件
    1
    nano ~/.bashrc
    在.bashrc中添加
    1
    2
    export PATH=/usr/local/cuda-12.1/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH
    执行source ~/.bashrc快速让配置生效

5.输入nvcc -V测试

安装ninja、packaging

ninjia用于更快的构建系统
Packaging用于解析版本号和环境要求

1
pip install packaging ninja

安装Flash Attention

1
pip install -U flash-attn --no-build-isolation

模型下载

下载modelscope模型下载器

1
pip install modelscope

有以下模型

1
2
3
4
5
Qwen3-TTS-12Hz-1.7B-VoiceDesign
Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTS-12Hz-1.7B-Base
Qwen3-TTS-12Hz-0.6B-CustomVoice
Qwen3-TTS-12Hz-0.6B-Base

-Base可以模仿预设语音
-CustomVoice可以选择官方给定语音
-VoiceDesign可输入自然语言指定语言

下载命令

1
modelscope download --model Qwen/Qwen3-TTS-12Hz-1.7B-Base --local_dir ./dir

--local_dir后面接下载目录

安装SoX

1
2
sudo apt update
sudo apt install libsox-fmt-all sox

启动

1
qwen-tts-demo --checkpoint ./checkpoints/Qwen3-TTS-12Hz-0.6B-Base --ip 0.0.0.0 --port 8000 --flash-attn

--checkpoint后接模型下载目录,接着在浏览器中输入127.0.0.1:8000既可快速测试

客户端

待补充