后端

以WSL为例一切都在一个虚拟环境中运行，推荐python3.12.x

拉取官方仓库

1	git clone https://github.com/QwenLM/Qwen3-TTS.git

接着进入仓库文件夹，在里面执行pip install -e .

1 2	cd Qwen3-TTS pip install -e .

pip install -e .会自动下载、配置当前目录中pyproject.toml和setup.py文件中指定的资源，运行后，名为qwen-tts的指令将存在于当前虚拟环境，并且如果当前目录下的文件有所改变，指令qwen-tts也会跟着改变

1	pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu126

这里版本选择的是CUDA 12.6

刚刚我们所安装的pytorch的CUDA版本为12.6，为保证版本一致，这里CUDA Toolkit也使用12.6版本
可以参考CUDA Toolkit官网
这里以Ubuntu22.04LST的WSL版本为例，使用deb(network)方法，最省事

获取.deb文件，可以理解为安装凭证，有了它才能下载nvidia的东西

1	wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb

安装deb文件

1	sudo dpkg -i cuda-keyring_1.1-1_all.deb

更新apt-get并安装CUDA-Toolkit

1 2	sudo apt-get update sudo apt-get -y install cuda-toolkit-13-2

添加环境变量
进入.bashrc初始文件

1	nano ~/.bashrc

在.bashrc中添加

1 2	export PATH=/usr/local/cuda-12.1/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH

执行source ~/.bashrc快速让配置生效

5.输入nvcc -V测试

ninjia用于更快的构建系统
Packaging用于解析版本号和环境要求

1	pip install packaging ninja

1	pip install -U flash-attn --no-build-isolation

下载modelscope模型下载器

1	pip install modelscope

有以下模型

Qwen3-TTS-12Hz-1.7B-VoiceDesign
Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTS-12Hz-1.7B-Base
Qwen3-TTS-12Hz-0.6B-CustomVoice
Qwen3-TTS-12Hz-0.6B-Base

-Base可以模仿预设语音
-CustomVoice可以选择官方给定语音
-VoiceDesign可输入自然语言指定语言

下载命令

1	modelscope download --model Qwen/Qwen3-TTS-12Hz-1.7B-Base --local_dir ./dir

--local_dir后面接下载目录

1 2	sudo apt update sudo apt install libsox-fmt-all sox

1	qwen-tts-demo --checkpoint ./checkpoints/Qwen3-TTS-12Hz-0.6B-Base --ip 0.0.0.0 --port 8000 --flash-attn

--checkpoint后接模型下载目录，接着在浏览器中输入127.0.0.1:8000既可快速测试

待补充