[原创]RVC微调底模-悦 f048K - 妙音-RVC音色模型工坊-妙音-RVC音色模型工坊

[原创]RVC微调底模-悦 f048K

[原创]RVC微调底模-悦 f048K

1年前更新

很高兴，今天我们发布妙音微调后的新基础模型，该模型是在RVC2的基础模型上微调的，下面是训练的部分语言介绍时长。

新增：日语≈10小时高质量语音包括多人说话数据集以及部分动漫数据集。

新增：中文≈15小时高质量录音棚音质。

新增：2小时中文歌曲数据集。

目前在1.0中我们暂时新增了这两种语音，至于新微调的底部训练出的模型质量是否能达到比较好的一个水平，我们正在测试当中，但目前我们已经实现用很少部分的数据能成功训练出一个推理模型。这个一个很不错的开始。

由于微调的模型数据比较大，这对于我们GPU特别紧张的情况下，我们只step了30000步。

这张曲线如果看不懂的话，可以在使用帮助中查看我们之前写的一篇文章有详细说明，我们的损失值一直都是跌宕起伏至少看G模型的损失值是这样的，我无法通过少量的训练去判断，但目前在测试这几个推理模型下来，表现还是挺好的，毕竟在RVC_v2中，底模就很优秀。

下面我将会用几段音频（底部模型直接推理，原数据集未训练。）

原音频

底部模型推理

在未给底部模型加入原音频数据情况下，底部模型的推理效果也能达到6-7分相似。

接下来第二段

原音频

底部模型推理

如果你仔细听，这些原音频虽然未在底部模型中，但是输出的音色却是非常的相似，在后续的推理模型训练中，只需要使用我们的底模+说话人（可能少部分的说话）+情绪语句，即可得到一个很好的推理模型。

当然后续我们将会继续完善该模型，当然永久炼丹师优先下载享用。

下面是使用教程：

将模型放入原生RVC项目中：

assets\pretrained_v2

直接将D以及G开头的两个pth文件解压到本文件夹目录下，请勿更改使用名称。

需要注意在训练当中的这几个参数。

目标采样率+高音+版本必须保持一致，因为我们的微调模型是在f048K下微调，所以这里一定要保持一致。

之后修改模型路径如果你目标采样率选择正确后你只需要

G模型路径：

assets/pretrained_v2/G_mygfyue48K.pth

D模型路径：

assets/pretrained_v2/D_mygfyue48K.pth

在训练前请注意训练模型的路径。

由于我们没有与RVC_V2的底模有过进行对比，这个将会在后期空闲时间进行比对。

D_mygfyue48K（model_hash）：b3640c5ac8fdc81b3934be1173d4f2a6ec2d815742f477632f9a727a442a7034

G_mygfyue48K（model_hash）：087e08d6e3992de28deba1cd87c7a56eac5b257b8b72d97c8fc83c94f2a6e99b

后续计划，继续微调其他语音，对唱歌部分进行微调。

最新活动

开通永久会员可享受一次免费专属模型定制，额外赠送Mygf-f040k预训练底膜，全场精品模型无限制免费下载。
开通普通会员全场精品模型每日限量下载，免费模型无限制下载。
模型定制区全面开通，最优惠的价格，响应速度快，模型质量高。模型定制100起，快来定制您的专属模型吧。

© 版权声明

本网站基于开源项目RVC项目训练的AI模型，旨在为声音克隆技术的研究和应用提供支持。我们明确声明，本网站不拥有任何模型中所含音色的版权，也不对这些音色的版权问题负责。用户在使用本网站提供的AI模型时，应确保其使用行为不侵犯任何第三方的版权或其他合法权益。本网站不承担因用户使用模型而可能产生的任何版权纠纷或法律责任。本网站提供的AI模型仅供个人学习和研究使用，未经本网站明确授权，用户不得将模型用于任何商业用途，包括但不限于销售、出租、出借或以其他任何形式进行商业化利用。本网站提供的某些AI模型可能涉及收费下载服务。用户支付的费用是用于支持本网站的运营成本、技术开发和维护服务，并非购买模型的版权。用户在购买收费模型时，应仔细阅读并同意相关的购买条款和说明。一旦完成购买，用户获得的是对模型的有限使用权，而非模型的所有权或版权。

THE END

宝藏模型使用帮助
# rvc # 模型 # 下载 # 免费 # 底膜 # 底部模型 # 微调 # 妙音工坊

喜欢就支持一下吧

相关推荐

评论抢沙发

请登录后发表评论

请登录后查看评论内容