[原创]RVC微调底模-悦 f048K
很高兴,今天我们发布妙音微调后的新基础模型,该模型是在RVC...
很高兴,今天我们发布妙音微调后的新基础模型,该模型是在RVC2的基础模型上微调的,下面是训练的部分语言介绍时长。 新增:日语≈10小时高质量语音包括多人说话数据集以及部分动漫数据集。 新增:中文≈15小时高质量录音棚音质。 新增:2小时中文歌曲数据集。 目前在1.0中我们暂时新增了这两种语音,至于新微调的底部训练出的模型质量是否能达到比较好的一个水平,我们正在测试当中,但目前我们已经实现用很少部分的数据能成功训练出一个推理模型。这个一个很不错的开始。 由于微调的模型数据比较大,这对于我们GPU特别紧张的情况下,我们只step了30000步。 这张曲线如果看不懂的话,可以在使用帮助中查看我们之前写的一篇文章有详细说明,我们的损失值一直都是跌宕起伏至少看G模型的损失值是这样的,我无法通过少量的训练去判断,但目前在测试这几个推理模型下来,表现还是挺好的,毕竟在RVC_v2中,底模就很优秀。 下面我将会用几段音频(底部模型直接推理,原数据集未训练。) 原音频 https://apis.klrvc.com/wp-content/uploads/2025/04/e463ae906120250402172143.mp3 底部模型推理 https://apis.klrvc.com/wp-content/uploads/2025/04/b7f74f241520250402172411.mp3 在未给底部模型加入原音频数据情况下,底部模型的推理效果也能达到6-7分相似。 接下来第二段 原音频 https://apis.klrvc.com/wp-content/uploads/2025/04/52d9f32fd220250402172840.mp3 底部模型推理 https://apis.klrvc.com/wp-content/uploads/2025/04/ff0ff66eb420250402172911.mp3...
rvc, 下载, 免费, 妙音工坊, 底膜, 底部模型, 微调, 模型
使用帮助