惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

博客园 - 幽冥狂_七

vue2 中把页面导出pdf Nuxt 文档 gird 布局合并了行和列 原位置不动 SemanticKernel Stable diffusion语法 CSS实现点击翻转效果 记录.net8支付宝手机网页应用的过程 读取.net core配置文件appsetting.json内容 chromedriver版本 Sql Server触发器调用exe控制台程序 秒杀的简单例子 Vue3 Slot—插槽全家桶使用详解 转载一篇文章:专升本这场荒唐的闹剧终于结束了 单行文本过多、多文本过多出现省略号或小点点 .NET 程序员的调试神器-Dumpify vue3中使用swiper的完整版教程 highchart x轴第一个日期有省略号 - 幽冥狂_七 highchart柱状图添加最小高度 Windows11专业版KMS命令激活(不需要激活工具) 微信小程序配置自动更新,微信小程序自动升级
Cosyvoice本地部署指令文档
幽冥狂_七 · 2024-09-08 · via 博客园 - 幽冥狂_七

https://www.bilibili.com/video/BV14S421R76v/?spm_id_from=333.788&vd_source=02f2aad32c21e62474c9d52666b96f92 视频教程

特别注意事项:

1、文档可能不全面,一些细节没有体现,结合视频教程食用更佳;

2、所有相关的软件、文件名称不要使用中文名称,也不要有中文路径。

C盘的中文用户名也不行,需要转移到别的非中文路径下。

AI框架CUDA和cuDNN的安装(如果已安装,可跳过):

//检查显卡支持的最大CUDA版本命令行指令

nvidia-smi

//检查是否安装CUDA成功的命令行指令

nvcc -V

PS:CUDNN下载需要登录,登录不了的可以用如下方法免登录下载: 1. 找到要下载的版本,右键复制链接,把链接最后面的斜杠删掉,一定要删掉最后的斜杠噢,2. 打开迅雷,粘贴链接,然后就可以下载了,还挺快的

项目部署流程:

PS:如果命令行窗口执行过程中,一直提示SSLError或HTTPSConnectionError错误,可以设置使用代理端口克隆和下载三方库:

代理端口地址需要通过kexue上网获取!

设置方式:在命令行窗口运行以下指令

然后执行下面的项目克隆和安装三方库。

一、使用Git克隆代码

Git安装(如果安装过Git,可跳过):

Git克隆项目文件到本地:

cd CosyVoice

git submodule update --init --recursive

PS:国内用户如果克隆失败,可以多尝试几次。有魔法的话,建议开魔法克隆。

二、创建环境和安装三方库:

1. 安装Miniconda(如果安装过conda,可跳过)

如果安装成功:输入conda --version,能返回conda版本号

2. 创建虚拟环境:

conda create -n cosyvoice python=3.8

conda activate cosyvoice

PS:如果提示CondaError: Run 'conda init' before 'conda activate',可先执行conda init,再重新操作。

3. 下载三方库

(1) 安装pynini和pyarrow:

conda install -y -c conda-forge pynini==2.1.5 pyarrow

(2) 安装其他三方库:

PS:安装前需先将requirements.txt中关于onnxruntime库的内容,删除系统判断的逻辑,改为onnxruntime-gpu==1.16.0

官方推荐,速度慢点:

其他镜像:

PS:如果torch-2.0.1+cu118-cp38-cp38-win_amd64.whl下载过慢,可手动下载该文件后,重新激活虚拟环境,然后手动安装该库,速度会快很多。

步骤:

重新激活虚拟环境,运行手动安装指令:指令格式为

例如:

手动安装该库成功后,重新执行安装三方库指令(pip install -r requirements.txt......),这样系统会继续安装别的库了,直到全部安装完。

三、下载模型:

新建Python程序下载模型:

python程序代码:

from modelscope import snapshot_download

snapshot_download('iic/CosyVoice-300M', local_dir='pretrained_models/CosyVoice-300M')

snapshot_download('iic/CosyVoice-300M-SFT', local_dir='pretrained_models/CosyVoice-300M-SFT')

snapshot_download('iic/CosyVoice-300M-Instruct', local_dir='pretrained_models/CosyVoice-300M-Instruct')

snapshot_download('iic/CosyVoice-ttsfrd', local_dir='pretrained_models/CosyVoice-ttsfrd')

也可激活虚拟环境,直接执行Python程序download_models.py

python download_models.py

四、新建启动文件:

新建3个启动程序的批处理文件;

内置音色生成指令:

@echo off

call conda activate cosyvoice

python webui.py --port 50000 --model_dir pretrained_models/CosyVoice-300M-SFT

pause

克隆音色+跨语种克隆指令:

@echo off

call conda activate cosyvoice

python webui.py --port 50001 --model_dir pretrained_models/CosyVoice-300M

pause

内置音色+语气微调指令:

@echo off

call conda activate cosyvoice

python webui.py --port 50002 --model_dir pretrained_models/CosyVoice-300M-Instruct

pause

也可下载3个启动文件,复制到文件夹内直接点击运行,会自动打开浏览器运行。

五、安装FFmpeg(非必要)

PS:要使用非wav格式的音频,需安装FFmpeg(也可用剪辑软件将其转为wav格式)。

下载解压后,将其目录下的bin路径配置到系统环境变量的path变量中。

例如:D:\ffmpeg\bin

FFmpeg下载地址:

————项目使用教程————

————入门使用————

一、根据功能需求,点击对应的.bat文件启动程序。

1. 内置音色生成;

2. 克隆音色+跨语种克隆;

3. 内置音色生成+语气微调;

浏览器页面会同步打开,但是不显示内容。需等待命令行窗口加载完成后,刷新下网页即可显示程序界面。

PS:注意,该项目占用显存较大,尽量每次都只启动一个程序,不要同时启动多个程序,否则可能会爆显存。

二、语气微调的Prompt可参考官网的instruction内容: