歸藏(guizang.ai) Profile picture
May 8, 2023 14 tweets 4 min read Read on X
答应大家的AI歌手教程来了,手把手教你训练你自己的AI歌手,主要分为使用模型和训练模型两部分,这里是第一部分如何使用模型生成音乐的部分,主要介绍了音源的处理,模型的使用和后期音轨的合成。
看在藏师傅生病肝教程的份上希望各位多多支持,下面是具体步骤🧶
详细教程和文件下载可以看这里:mp.weixin.qq.com/s/bXD1u6ysYkTE… Image
要使用模型进行推理的话你首先需要一段已经演唱好的声音垫进去,所以我们需要先对你垫进去的声音进行处理。
首先要安装UVR_v5.5.0,完成后我们需要给UVR增加一个模型解压UVR5模型文件将里面的两个文件夹粘贴到安装目录下的Ultimate Vocal Removermodels就行。 Image
在处理之前你需要把你声音的格式转换成WAV格式,因为So-VITS-SVC 4.0只认WAV格式的音频文件,现在处理了后面会省事点。可以用这个工具处理:aconvert.com/cn/audio/mp4-t… Image
处理完音频文件后我们就要开始利用UVR去掉背景音了,一共需要过两次,每次的设置都是不同的,下面两张图分别是两次的参数。 ImageImage
接下来我们就要运行整合包的Web UI来推理声音了,如果你用的其他人的模型的话你需要先把模型文件放进整合包对应的文件夹下面:

首先是模型文件夹下面后缀为pth和pt的两个文件放到整合包的logs44k文件夹下。

之后是模型文件里那个叫config.json的json文件,放到整合包的configs文件夹下面。 Image
接下来我们就可以运行整合包的Web UI了,打开整合包根目录下的【启动webui.bat】这个文件他会自动运行并打开Web UI的网页,经常玩Stable Diffusion的朋友肯定对这个操作不陌生。

下面就是Web UI的界面我们使用模型的时候主要用的是推理这个功能。 Image
之后就是选择我们的模型,如果你刚才已经把模型放到合适的位置的话你现在应该能在下图的两个位置选择到你的模型和配置文件,如果有报错会在输出信息的位置显示。 Image
选择完模型之后我们需要点击加载模型,等待一段时间Loading之后模型会加载完成。Output Message这里会输出加载的结果。 Image
之后就是上传我们处理好的需要垫的音频文件了,把文件拖动到红框位置就行。
接下来是两个比较重要的选项怕【聚类f0】会让输出效果更好,但是如果你的文件是歌声的话不要勾选这个选项,不然会疯狂跑调。【F0均值滤波】主要解决哑音问题,如果你输出的内容有比较明显的哑音的话可以勾选尝试一下。 ImageImage
设置好之后我们点击【音频转换】按钮之后经过一段时间的运算,就可以生成对应的音乐了。
【output audio】的位置就是生成的音频了可以试听,如果觉得OK的话可以,点击右边三个点弹出的下载按钮下载。 ImageImage
我们现在生成的是一段只有人声的干声,这时候我们刚才剥离出来的伴奏就有用了,把两段音频合成就行,我用的剪映,直接把两段音轨拖进去导出就行,也可以加张图片变成视频。 Image
好了模型的使用部分到这里就结束了,理论上你现在如果有孙燕姿的模型的话已经可以生产AI音乐了。垫的音频文件也有一些要求,首先肯定是人声要清晰,伴奏最好少点去的也干净同时效果也会更好。感谢支持。
详细教程和文件可以在这里查看:mp.weixin.qq.com/s/bXD1u6ysYkTE… Image
对了上面林俊杰的模型是我自己炼的,步数比较少,效果没有孙燕姿这个好,轻拍

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏(guizang.ai)

歸藏(guizang.ai) Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

Sep 7
用即梦 (Seed dream) 4 图像模型给自己做一个非常有质感的头像

这还原的也太好了,关键的 ID 要素都还原了,而且有那种非常有质感的笔触效果

提示词在下面👇 Image
提示词:参考图一的风格和样式为图2的角色生成一个图标,图标下方的文字应该为“guizang”

垫了下这个画头像老哥的图,注意自己玩可以不要盈利哈,尤其是垫图这种方式
也可以给你喜欢的游戏或者动漫角色画

优化后的提示词:参考图1的风格和样式为图2的角色生成一个图标,同时只要参考图2的头部位置,像一个头像图标,图标下方的文字应该为“Jinx” Image
Read 5 tweets
Sep 2
卧槽

今天就一顿捣鼓解决了 Nano Banana 最恶心的一个问题

你现在可以自定义他生成和修改后的图片比例了

👇下面是详细教程: Image
用 Nano Banana 多的朋友可能发现了,就是 Nano Banana 在有多张图片输入的时候,输出图的比例会跟其中一张相同,只不过这个过程很不可控。

藏师傅经过一顿科研发现,你可以用这个方法重新跑一次拯救你的旧图,而且新生成的图片也可以再跑一次重新定义生成比例。
我们需要两张图片来完成这个任务:

首先肯定是你之前生成的结果图,或者是你从其他地方获取的图片只是想更改比例也可以的。

比如我前几天做的这个 AI 书法舞女,由于书法字体每张截图都不一样大,导致生成的图片大小也不一样,很烦,为了生成视频我还得自己裁切,这样就容易丢失信息。 Image
Read 10 tweets
Aug 30
大聪明(赛博禅心)刚才发了个 Nano Banana 一图读懂XXX的提示词

非常适合用来学习和解释一些概念,浅显易懂

但他那个是针对 Lovart 搞的,我优化了一下,现在单独用Nano Banana也可以稳定生成,而且排版更加一致

下面👇是提示词 Image
Image
Image
Image
提示词:

Help me generate multiple 16:9 doodle-style images to explain the concept of "futures" to middle school students. The images should have a consistent colorful, thick-pencil hand-drawn style, be rich in information, feature English text, use solid color backgrounds, have outlines around the cards, and include uniform titles, similar to a PowerPoint presentation.
上面中文部分是我自己figma排的,需要中文的话可以用图片Vibe Coding一下
Read 5 tweets
Aug 26
开个帖子记录一下 Gemini 2.5 Flash Image 模型我发掘的一些用法,会持续更新,建议收藏

首先这个模型支持多图参考,为了你提示词好写,你可以给多张图片加上标记

比如这里就是 A 的背景、B 的沙发以及 C 的人物 Image
ID 保持真的很牛批,比如让藏师傅变瘦 Image
Image
这国内的美颜相机、醒图之类的难了啊,现在做这类产品直接提示词就行
Read 30 tweets
Aug 21
谷歌昨晚发布会几乎给所有硬件和内置 APP 上加上了 Gemini

开个帖子整理了一下谷歌这些硬件上加的 AI 功能:

所有 Pixel 10 手机均搭载 Google Tensor G5 芯片,可以本地运行 Gemini Nano 模型 Image
Magic Cue 功能:
支持将所有谷歌应用的信息串联起来,在合适的地方建议你在 Messages 应用中一键分享
Read 17 tweets
Jul 2
这周藏师傅呕心沥血的大活来了!

Gemini CLI 不写代码帮普通人提效的的一万种用法!

- 如何低门槛两步用上 Gemini CLI
- 批量修改系统设置
- 编辑查找文档,生成 PPT
- 剪辑视频、修改图片、下载视频
-不同文档格式的互转 等等

下面是详细的教程和案例🧵 Image
等不及施工的可以先收藏

或者直接看这里:mp.weixin.qq.com/s/Frdf_Gh3Xhvv…
来看一下我会教你用 Gemini CLI 实现哪些能力:

如何低门槛两步用上 Gemini CLI
查找和批量编辑本地文档
分析你的 Obsidian 笔记库,将相关的笔记链接起来
分析本地图片内容批量修改文件名,给图片打标
批量修改系统设置,创建你的工作模式一键开关
为本地文档生成效果丰富美观的 PPT
帮你剪辑和处理本地视频,加水印、转 gif、加音乐。。。
帮你快速批量下载 youtube 等网站视频和封面
帮你处理图片,加滤镜、加水印、改大小、多张拼合。。。
帮你实现不同文档格式的互转,Markdown 转 Word。。。
Read 19 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(