252 字
1 分钟
Index-tts使用教程
Index-tts使用教程
index-tts 是一个开源的零样本语音复制工具。主要支持中文和英文。仅需要几秒的语音素材,就可以克隆出非常相近的语音音色。
环境
- WSL2 Ubuntu20
- 3060tap 6GB显存
下载
首先在wsl2,中使用git 进行下载源码
git clone https://github.com/index-tts/index-tts.git
然后进行新建一个conda环境
conda create -n index-tts python=3.10conda activate index-tts再安装ffmpeg。(这是一个非常牛逼的格式转换内核)
sudo apt-get updatesudo apt-get install ffmpeg然后安装指定版本torch
pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118最后进入到index-tts文件夹,把index-tts 添加为包
cd index-ttspip install -e .然后从huggingface上下载模型
可以先换一下下载源,这样从中国下载应该要快些
export HF_ENDPOINT="https://hf-mirror.com"huggingface-cli download IndexTeam/IndexTTS-1.5 \ config.yaml bigvgan_discriminator.pth bigvgan_generator.pth bpe.model dvae.pth gpt.pth unigram_12000.vocab \ --local-dir checkpoints然后直接启动webui
python webui.py
启动结束后,在浏览器中输入:http://127.0.0.1:7860进入webui

然后上传10s左右的wav格式的音频就可以开始生成。
Index-tts使用教程
https://blog.eachic.me/posts/index-tts/index-tts/