这是一个令人振奋的一次训练模型,此刻我们使用了最新微调的预训练模型。
该模型数据集约在15分钟,里面包含了原始对话以及语气表现等,模型一共走了24000 steps
(部分训练损失函数曲线)
在推理方面测试,咬字方面会比默认低模会更优一些,包括对歌曲方面的优化也是相对于比较好的。
但是模型唯一一点需要注意的地方,就是对于呼吸方面并不是太理想,可能是原始数据中的呼吸处理的时候响度不够又或者分离的时候呼吸部分丢失。第二次训练,我尝试加入相对应的呼吸声,稍微有些许缓解,但如果在使用过程中需要配合声卡抑制原始呼吸声或尽量呼吸声需要小。
在测试语气方面,比如“说着说着轻轻笑”还是没问题,但如果笑的很大声就会出现电流音,这也是这款模型目前的缺点。
当然每个人的设备以及输入不一样的到的效果可能也都不一样。
最新活动
© 版权声明
本网站基于开源项目RVC项目训练的AI模型,旨在为声音克隆技术的研究和应用提供支持。我们明确声明,本网站不拥有任何模型中所含音色的版权,也不对这些音色的版权问题负责。
用户在使用本网站提供的AI模型时,应确保其使用行为不侵犯任何第三方的版权或其他合法权益。本网站不承担因用户使用模型而可能产生的任何版权纠纷或法律责任。
本网站提供的AI模型仅供个人学习和研究使用,未经本网站明确授权,用户不得将模型用于任何商业用途,包括但不限于销售、出租、出借或以其他任何形式进行商业化利用。
本网站提供的某些AI模型可能涉及收费下载服务。用户支付的费用是用于支持本网站的运营成本、技术开发和维护服务,并非购买模型的版权。用户在购买收费模型时,应仔细阅读并同意相关的购买条款和说明。一旦完成购买,用户获得的是对模型的有限使用权,而非模型的所有权或版权。
THE END
请登录后查看评论内容