Releases: RVC-Project/Retrieval-based-Voice-Conversion-WebUI
2.2.231006
完整包 Complete package
For Nvidia GPU users:
https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC1006Nvidia.7z
For AMD/Intel GPU users:
https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC1006AMD_Intel.7z
中国用户可使用以下2个源加速下载
1、无需登录,免费满速下载链接https://www.123pan.com/s/5tIqVv-QHNcv.html
2、有度盘超级会员的可以用度盘https://pan.baidu.com/s/19530AOh2H3Feuti_D51cXw?pwd=reqy
Changelog (English verison):
我们制作了一个用于实时变声的界面go-realtime-gui.bat/gui_v1.py(事实上早就存在了),本次更新重点也优化了实时变声的性能。对比0813版:
- 1、优优化界面操作:参数热更新(调整参数不需要中止再启动),懒加载模型(已加载过的模型不需要重新加载),增加响度因子参数(响度向输入音频靠近)
- 2、优化自带降噪效果与速度
- 3、大幅优化推理速度
注意输入输出设备应该选择同种类型,例如都选MME类型。
1006版本整体的更新为:
- 1、继续提升rmvpe音高提取算法效果,对于男低音有更大的提升
- 2、优化推理界面布局
2.1.230814
完整包 Complete package
For Nvidia GPU users:
https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC0813Nvidia.7z
For AMD/Intel GPU users:
https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC0813AMD_Intel.7z
中国用户可使用以下2个源加速下载
1、无需登录,免费满速下载链接https://www.123pan.com/s/5tIqVv-QHNcv.html
2、有度盘超级会员的可以用度盘https://pan.baidu.com/s/19530AOh2H3Feuti_D51cXw?pwd=reqy
Changelog (English verison):
1-常规bug修复
- 保存频率总轮数最低改为1 总轮数最低改为2
- 修复无pretrain模型训练报错
- 增加伴奏人声分离完毕清理显存
- faiss保存路径绝对路径改为相对路径
- 支持路径包含空格(训练集路径+实验名称均支持,不再会报错)
- filelist取消强制utf8编码
- 解决实时变声中开启索引导致的CPU极大占用问题
2-重点更新
- 训练出当前最强开源人声音高提取模型RMVPE,并用于RVC的训练、离线/实时推理,支持pytorch/onnx/DirectML
- 通过pytorch-dml支持A卡和I卡的
(1)实时变声(2)推理(3)人声伴奏分离(4)训练暂未支持,会切换至CPU训练;通过onnx_dml支持rmvpe_gpu的推理
Please look forward to the pretrained base model of RVCv3, which has larger parameters, larger training data, better results, unchanged inference speed, and requires less training data for training.
2.0.230618
完整包 Complete package (已更新至最新版本 Has been updated to the latest version.)
https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC-beta.7z
0619update: If you're using small model extract feature, you should update this file because there is a small bug when config is v2-32k/48k
How to update from 0528v2 version:
1、download or clone updated codes from github, and replace 0528v2 version.
2、download new pretrained_v2 weights from https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main/pretrained_v2 (32k and 48k weights needed. 40k has already been supported in 0528v2 version)
Changelog:
- v2增加32k和48k两个新预训练模型
- 修复非f0模型推理报错
- 对于超过一小时的训练集的索引建立环节,自动kmeans缩小特征处理以加速索引训练、加入和查询
- 附送一个人声转吉他玩具仓库
- 数据处理剔除异常值切片
- onnx导出选项卡
2.0.230528
完整包 base package (已更新至最新版本 Has been updated to the latest version.)
https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC-beta.7z
0528v2 更新包 updated package
下过老完整包的用户可以只下更新包 Users that downloaded old base package can use the updated package.
见下方Assets
, 解压到RVC根目录覆盖完整包下的一些文件 Unzip it in RVC root and replace some files of old version.
对比上个0428版本,划重点(Compared to the previous 0428 version, the most significant updates are):
1、增加了v2版本模型支持 (Updated to v2 model)
2、保护呼吸、清辅音、齿音,削减电音 (Protect voiceless consonant and breath, less artifact)
3、增加crepe推理,音高哑音更少 (Crepe (deep-learning based method) pitch detect model supported)
4、人声伴奏分离新引入了UVR5中的去混响和去延迟模型 (Dereverb and de-echo model in UVR5 supported)
20230528更新
- 增加v2的jupyter notebook,韩文changelog,增加一些环境依赖
- 增加呼吸、清辅音、齿音保护模式
- 支持crepe-full推理
- UVR5人声伴奏分离加上3个去延迟模型和MDX-Net去混响模型,增加HP3人声提取模型
- 索引名称增加版本和实验名称
- 人声伴奏分离、推理批量导出增加音频导出格式选项
- 废弃32k模型的训练
todolist:
- 特征检索增加时序维度
- 特征检索增加pre-kmeans可选项
- 特征检索增加PCAR降维可选项
- 支持onnx推理(附带仅推理的小压缩包)
- 训练时在音高、gender、eq、噪声等方面对输入进行随机增强
- 补全v2版本的48k预训练模型
20230513更新
- 清除一键包内部老版本runtime内残留的infer_pack和uvr5_pack
- 修复训练集预处理伪多进程的bug
- 增加harvest识别音高可选通过中值滤波削弱哑音现象,可调整中值滤波半径
- 导出音频增加后处理重采样
- 训练n_cpu进程数从"仅调整f0提取"改为"调整数据预处理和f0提取"
- 自动检测logs文件夹下的index路径,提供下拉列表功能
- tab页增加"常见问题解答"(也可参考github-rvc-wiki)
- 相同路径的输入音频推理增加了音高缓存(用途:使用harvest音高提取,整个pipeline会经历漫长且重复的音高提取过程,如果不使用缓存,实验不同音色、索引、音高中值滤波半径参数的用户在第一次测试后的等待结果会非常痛苦)
20230514更新
- 音量包络对齐输入混合(可以缓解“输入静音输出小幅度噪声”的问题。如果输入音频背景底噪大则不建议开启,默认不开启(值为1可视为不开启))
- 支持按照指定频率保存提取的小模型(假如你想尝试不同epoch下的推理效果,但是不想保存所有大checkpoint并且每次都要ckpt手工处理提取小模型,这项功能会非常实用)
- 通过设置环境变量解决服务端开了系统全局代理导致浏览器连接错误的问题
- 支持v2预训练模型(目前只公开了40k版本进行测试,另外2个采样率还没有训练完全)
- 推理前限制超过1的过大音量
- 微调数据预处理参数
1.2.230428
完整包 base package (已更新至最新版本 Has been updated to the latest version.)
https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC-beta.7z
20230428 更新包 updated package
下过老完整包的用户可以只下更新包 Users that downloaded old base package can use the updated package.
见下方Assets
, 解压到RVC根目录覆盖完整包下的一些文件 Unzip it in RVC root and replace some files of old version.
更新日志
20230428更新
- 升级faiss索引设置,速度更快,质量更高
- 取消total_npy依赖,后续分享模型不再需要填写total_npy
- 解锁16系限制。4G显存GPU给到4G的推理设置。
- 修复部分音频格式下UVR5人声伴奏分离的bug
- 实时变声迷你gui增加对非40k与不懈怠音高模型的支持
后续计划:
功能:
- 增加选项:每次epoch保存的小模型均进行提取
- 增加选项:推理额外导出mp3至填写的路径
- 支持多人训练选项卡(至多4人)
底模:
- 收集呼吸wav加入训练集修正呼吸变声电音的问题
- 我们正在训练增加了歌声训练集的底模,未来会公开
- 升级鉴别器
- 升级自监督特征结构
1.1.230416
完整包 base package
https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC-beta.7z
20230416 更新包 updated package
下过老完整包的用户可以只下更新包 Users that downloaded old base package can use the updated package.
见下方Assets
, 解压到RVC根目录覆盖完整包下的一些文件 Unzip it in RVC root and replace some files of old version.
更新日志
-
修正训练参数,提升显卡平均利用率,A100最高从25%提升至90%左右,V100:50%->90%左右,2060S:60%->85%左右,P40:25%->95%左右,训练速度显著提升
-
修正参数:总batch_size改为每张卡的batch_size
-
修正total_epoch:最大限制100解锁至1000;默认10提升至默认20
-
修复ckpt提取识别是否带音高错误导致推理异常的问题
-
修复分布式训练每个rank都保存一次ckpt的问题
-
特征提取进行nan特征过滤
-
修复静音输入输出随机辅音or噪声的问题(老版模型需要重做训练集重训)
-
新增本地实时变声迷你GUI,双击go-realtime-gui.bat启动
-
训练推理均对<50Hz的频段进行滤波过滤
-
训练推理音高提取pyworld最低音高从默认80下降至50,50-80hz间的男声低音不会哑
-
WebUI支持根据系统区域变更语言(现支持en_US,ja_JP,zh_CN,zh_HK,zh_SG,zh_TW,不支持的默认en_US)
-
修正部分显卡识别(例如V100-16G识别失败,P4识别失败)
1.0.230410
完整包(base package)
https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/RVC-beta.7z
20230410更新包(解压到RVC根目录覆盖完整包下的一些文件)已放出(20230410updated package: unzip it in RVC root and replace some files of old version.)
更新日志见(changelog:)
https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/Changelog_CN.md