Qwen3-TTS部署
参考:
https://modelscope.cn/models/Qwen/Qwen3-TTS-12Hz-1.7B-Base
https://github.com/QwenLM/Qwen3-TTS
https://www.bilibili.com/video/BV1jXf2B6EQp/?spm_id_from=333.1387.homepage.video_card.click
https://blog.csdn.net/tanking66/article/details/141888300
后端
以WSL为例一切都在一个虚拟环境中运行,推荐python3.12.x
拉取官方仓库
1 | git clone https://github.com/QwenLM/Qwen3-TTS.git |
接着进入仓库文件夹,在里面执行pip install -e .
1 | cd Qwen3-TTS |
pip install -e .会自动下载、配置当前目录中pyproject.toml和setup.py文件中指定的资源,运行后,名为qwen-tts的指令将存在于当前虚拟环境,并且如果当前目录下的文件有所改变,指令qwen-tts也会跟着改变
安装torch
1 | pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu126 |
这里版本选择的是CUDA 12.6
使用 FlashAttention 2 以减少 GPU 显存占用(Windows跳过)
安装CUDA Toolkit
刚刚我们所安装的pytorch的CUDA版本为12.6,为保证版本一致,这里CUDA Toolkit也使用12.6版本
可以参考CUDA Toolkit官网
这里以Ubuntu22.04LST的WSL版本为例,使用deb(network)方法,最省事
- 获取.deb文件,可以理解为安装凭证,有了它才能下载nvidia的东西
1
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
- 安装deb文件
1
sudo dpkg -i cuda-keyring_1.1-1_all.deb
- 更新apt-get并安装CUDA-Toolkit
1
2sudo apt-get update
sudo apt-get -y install cuda-toolkit-13-2 - 添加环境变量
进入.bashrc初始文件在.bashrc中添加1
nano ~/.bashrc
执行1
2export PATH=/usr/local/cuda-12.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATHsource ~/.bashrc快速让配置生效
5.输入nvcc -V测试
安装ninja、packaging
ninjia用于更快的构建系统Packaging用于解析版本号和环境要求
1 | pip install packaging ninja |
安装Flash Attention
1 | pip install -U flash-attn --no-build-isolation |
模型下载
下载modelscope模型下载器
1 | pip install modelscope |
有以下模型
1 | Qwen3-TTS-12Hz-1.7B-VoiceDesign |
-Base可以模仿预设语音-CustomVoice可以选择官方给定语音-VoiceDesign可输入自然语言指定语言
下载命令
1 | modelscope download --model Qwen/Qwen3-TTS-12Hz-1.7B-Base --local_dir ./dir |
--local_dir后面接下载目录
安装SoX
1 | sudo apt update |
启动
1 | qwen-tts-demo --checkpoint ./checkpoints/Qwen3-TTS-12Hz-0.6B-Base --ip 0.0.0.0 --port 8000 --flash-attn |
--checkpoint后接模型下载目录,接着在浏览器中输入127.0.0.1:8000既可快速测试
客户端
待补充