歸藏 Profile picture
May 8 14 tweets 4 min read Twitter logo Read on Twitter
答应大家的AI歌手教程来了,手把手教你训练你自己的AI歌手,主要分为使用模型和训练模型两部分,这里是第一部分如何使用模型生成音乐的部分,主要介绍了音源的处理,模型的使用和后期音轨的合成。
看在藏师傅生病肝教程的份上希望各位多多支持,下面是具体步骤🧶
详细教程和文件下载可以看这里:mp.weixin.qq.com/s/bXD1u6ysYkTE… Image
要使用模型进行推理的话你首先需要一段已经演唱好的声音垫进去,所以我们需要先对你垫进去的声音进行处理。
首先要安装UVR_v5.5.0,完成后我们需要给UVR增加一个模型解压UVR5模型文件将里面的两个文件夹粘贴到安装目录下的Ultimate Vocal Removermodels就行。 Image
在处理之前你需要把你声音的格式转换成WAV格式,因为So-VITS-SVC 4.0只认WAV格式的音频文件,现在处理了后面会省事点。可以用这个工具处理:aconvert.com/cn/audio/mp4-t… Image
处理完音频文件后我们就要开始利用UVR去掉背景音了,一共需要过两次,每次的设置都是不同的,下面两张图分别是两次的参数。 ImageImage
接下来我们就要运行整合包的Web UI来推理声音了,如果你用的其他人的模型的话你需要先把模型文件放进整合包对应的文件夹下面:

首先是模型文件夹下面后缀为pth和pt的两个文件放到整合包的logs44k文件夹下。

之后是模型文件里那个叫config.json的json文件,放到整合包的configs文件夹下面。 Image
接下来我们就可以运行整合包的Web UI了,打开整合包根目录下的【启动webui.bat】这个文件他会自动运行并打开Web UI的网页,经常玩Stable Diffusion的朋友肯定对这个操作不陌生。

下面就是Web UI的界面我们使用模型的时候主要用的是推理这个功能。 Image
之后就是选择我们的模型,如果你刚才已经把模型放到合适的位置的话你现在应该能在下图的两个位置选择到你的模型和配置文件,如果有报错会在输出信息的位置显示。 Image
选择完模型之后我们需要点击加载模型,等待一段时间Loading之后模型会加载完成。Output Message这里会输出加载的结果。 Image
之后就是上传我们处理好的需要垫的音频文件了,把文件拖动到红框位置就行。
接下来是两个比较重要的选项怕【聚类f0】会让输出效果更好,但是如果你的文件是歌声的话不要勾选这个选项,不然会疯狂跑调。【F0均值滤波】主要解决哑音问题,如果你输出的内容有比较明显的哑音的话可以勾选尝试一下。 ImageImage
设置好之后我们点击【音频转换】按钮之后经过一段时间的运算,就可以生成对应的音乐了。
【output audio】的位置就是生成的音频了可以试听,如果觉得OK的话可以,点击右边三个点弹出的下载按钮下载。 ImageImage
我们现在生成的是一段只有人声的干声,这时候我们刚才剥离出来的伴奏就有用了,把两段音频合成就行,我用的剪映,直接把两段音轨拖进去导出就行,也可以加张图片变成视频。 Image
好了模型的使用部分到这里就结束了,理论上你现在如果有孙燕姿的模型的话已经可以生产AI音乐了。垫的音频文件也有一些要求,首先肯定是人声要清晰,伴奏最好少点去的也干净同时效果也会更好。感谢支持。
详细教程和文件可以在这里查看:mp.weixin.qq.com/s/bXD1u6ysYkTE… Image
对了上面林俊杰的模型是我自己炼的,步数比较少,效果没有孙燕姿这个好,轻拍

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏

歸藏 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

May 8
手把手教你训练你自己的AI歌手,最重要的一步来了。如何训练歌手的模型。这一步主要由两部分组成数据处理和模型训练。
这个林俊杰是我自己训练的4800步的模型,对比一下上一篇教程里的孙燕姿模型有两万多步,数据的质量也很重要。
感谢各位的支持,下面是具体步骤🧶
详细教程和文件下载可以看这里:mp.weixin.qq.com/s/IeeW1PbMUbxM… Image
首先我们需要准备你训练的人的声音素材,尽量找质量比较高人声比较清晰的音频。

歌手的声音素材是比较好找的,因为他们的歌就是天然的素材,我们在训练的时候最少要准备30分钟以上的人声素材,一般一个小时到两个小时最好。但是声音的质量大于时间长度,不要为了凑数搞一些质量不那么好的素材。
Read 20 tweets
May 8
AIGC Weekly #20更新了,本期主要介绍了谷歌泄露的文件引发的讨论以及New Bing的一堆更新内容等和其他一堆非常值得阅读的内容。下面是上周一些行业动态和产品推荐,更多详细的内容可以去图里的竹白查看:op7418.zhubai.love/posts/22673345… Image
🥰本周精选(1):

谷歌泄露文档“我们没有护城河,OpenAI也没有”:semianalysis.com/p/google-we-ha…

Stability AI CEO Emad表示他同时文章中的大部分观点,但以创新为护城河很难建立企业:
Alex Dimakis也表示同意这些观点大学和开源社区应该组织更多的活动来管理数据集:

Andrej Karpathy表示预训练LLM基础模型仍然非常昂贵。由于最近的PEFT(参数高效训练)技术非常有效,因此微调LLM正在变得非常便宜且有效 Image
Read 15 tweets
May 7
测试了一下粤语的效果。AI孙燕姿《爱的太迟》,这个效果好太多了。
答应大家的教程来了,这是第一部分如何使用模型:
Read 4 tweets
May 7
前几天B站首页刷到了一个AI孙燕姿唱的黑色毛衣,给我听傻了,确实太像了。
所以这几天研究了一下,成果就是这个AI孙燕姿唱的红颜旧,还是有一些小瑕疵,音源的质量有点差。已经花两天大概摸清楚了使用和训练模型的方法,藏师傅再整个保姆级教程?
这里是另一个尝试,这个效果好点
答应大家的教程来了,这是第一部分如何使用模型:
Read 4 tweets
May 6
周六了,继续上传一下我上周 #晚安提示词 生成的所有图片,同时也对内容结构进行了更新,你现在能在页面看到所有图片相关主题的提示词和对应的推特教程了。
页面链接:walling.app/kDaEnjcPrTTkWy… Image
Read 5 tweets
May 5
#Midjourney晚安提示词 今天看到一篇文章主要是用Midjourney的Blend功能生成品牌的延展图形的,然后我就想试一下。上面的两张图片是原图,下面两张是混合生成。
下面是一些使用的技巧: twitter.com/i/web/status/1… ImageImageImageImage
我之前居然从来没用过blend功能,了解了一下是为了方便移动端使用做的一个功能官方说本质上相当于两段提示词一起使用,拿我之前的一些图进行了混合有一些居然有很好的效果。 Image
首先是如何使用,输入/blend来使用,最多支持五张图混合,但建议2-3张就行,多了效果不好。 Image
Read 8 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(