歸藏(guizang.ai) Profile picture
May 8, 2023 14 tweets 4 min read Read on X
答应大家的AI歌手教程来了,手把手教你训练你自己的AI歌手,主要分为使用模型和训练模型两部分,这里是第一部分如何使用模型生成音乐的部分,主要介绍了音源的处理,模型的使用和后期音轨的合成。
看在藏师傅生病肝教程的份上希望各位多多支持,下面是具体步骤🧶
详细教程和文件下载可以看这里:mp.weixin.qq.com/s/bXD1u6ysYkTE… Image
要使用模型进行推理的话你首先需要一段已经演唱好的声音垫进去,所以我们需要先对你垫进去的声音进行处理。
首先要安装UVR_v5.5.0,完成后我们需要给UVR增加一个模型解压UVR5模型文件将里面的两个文件夹粘贴到安装目录下的Ultimate Vocal Removermodels就行。 Image
在处理之前你需要把你声音的格式转换成WAV格式,因为So-VITS-SVC 4.0只认WAV格式的音频文件,现在处理了后面会省事点。可以用这个工具处理:aconvert.com/cn/audio/mp4-t… Image
处理完音频文件后我们就要开始利用UVR去掉背景音了,一共需要过两次,每次的设置都是不同的,下面两张图分别是两次的参数。 ImageImage
接下来我们就要运行整合包的Web UI来推理声音了,如果你用的其他人的模型的话你需要先把模型文件放进整合包对应的文件夹下面:

首先是模型文件夹下面后缀为pth和pt的两个文件放到整合包的logs44k文件夹下。

之后是模型文件里那个叫config.json的json文件,放到整合包的configs文件夹下面。 Image
接下来我们就可以运行整合包的Web UI了,打开整合包根目录下的【启动webui.bat】这个文件他会自动运行并打开Web UI的网页,经常玩Stable Diffusion的朋友肯定对这个操作不陌生。

下面就是Web UI的界面我们使用模型的时候主要用的是推理这个功能。 Image
之后就是选择我们的模型,如果你刚才已经把模型放到合适的位置的话你现在应该能在下图的两个位置选择到你的模型和配置文件,如果有报错会在输出信息的位置显示。 Image
选择完模型之后我们需要点击加载模型,等待一段时间Loading之后模型会加载完成。Output Message这里会输出加载的结果。 Image
之后就是上传我们处理好的需要垫的音频文件了,把文件拖动到红框位置就行。
接下来是两个比较重要的选项怕【聚类f0】会让输出效果更好,但是如果你的文件是歌声的话不要勾选这个选项,不然会疯狂跑调。【F0均值滤波】主要解决哑音问题,如果你输出的内容有比较明显的哑音的话可以勾选尝试一下。 ImageImage
设置好之后我们点击【音频转换】按钮之后经过一段时间的运算,就可以生成对应的音乐了。
【output audio】的位置就是生成的音频了可以试听,如果觉得OK的话可以,点击右边三个点弹出的下载按钮下载。 ImageImage
我们现在生成的是一段只有人声的干声,这时候我们刚才剥离出来的伴奏就有用了,把两段音频合成就行,我用的剪映,直接把两段音轨拖进去导出就行,也可以加张图片变成视频。 Image
好了模型的使用部分到这里就结束了,理论上你现在如果有孙燕姿的模型的话已经可以生产AI音乐了。垫的音频文件也有一些要求,首先肯定是人声要清晰,伴奏最好少点去的也干净同时效果也会更好。感谢支持。
详细教程和文件可以在这里查看:mp.weixin.qq.com/s/bXD1u6ysYkTE… Image
对了上面林俊杰的模型是我自己炼的,步数比较少,效果没有孙燕姿这个好,轻拍

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏(guizang.ai)

歸藏(guizang.ai) Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

Jun 18
来了!从案例分析到提示词写作

藏师傅手把手教你制作最火爆的 Veo3 AI视频

不只教你如何用视频模型,还会教你用各种工具分析视频从而生成新的创意,给你提示词模板。

让你从创意到生成全部自动化。甚至可以用来做视频 Agent 产品

先谢谢各位的转发和赞,我们开始👇
等不及施工🚧的可以看这里:

mp.weixin.qq.com/s/tRoEKCsZBBTE…
无论你是否关注 AI 最近肯定在不同的社交媒体上刷到了这类视频。

要不就是一个大猩猩或者其他动物对着镜头絮叨,要不就是各种虚构的历史事件的采访。

每一个点赞和播放都很高不管是在国内还是海外。

虽然很无聊但是刷到就看的停不下来,即使是我这种经常接触 AI 内容的人都是如此。 Image
Read 15 tweets
May 27
老是问我有没有国内能用的 Vibe Coding 产品,这次真有了!

美团除了一个叫 Nocode 的产品

不止能写展示类的网页,相当复杂的多页面完整产品他也能一次性搞定

比如这个逻辑非常复杂仓库商品管理工具,居然一次就搞定了

👇下面是详细测试和介绍
先来看一下产品能力:

支持通过提示词提出要求后生成网页应用

支持 AI 自动优化和发现问题,不需要详细描述自己会分析 bug 原因

支持对提示词词进行优化,帮你梳理需求

支持快速将生成的网页服务部署上线,还有专属域名(早来可以占上)

支持 Dev Mode 模式,用类似 Cursor 的在线工具编写代码

支持 DateBase,让你的用 AI 生成的产品不再是玩具,可以存储、管理巨量信息Image
你可以在这里使用 Nocode,免费、不需要邀请:nocode.cn
Read 8 tweets
May 21
开个帖子详细记录一下谷歌昨晚所有的发布

内容量要爆炸了,每个模型都有大幅提升

- Gemini 2.5 Pro Deep Think 模式
- Veo 3视频模型
- Imagen 4图像模型
- FLOW AI剪辑工具
- 谷歌搜索 AI 模式

👇是所有内容: Image
AI 模式即将面向美国所有用户推出。

它对搜索功能进行了彻底的重构,拥有更先进的推理能力,可以提出更长、更复杂的查询。

Deep Think in 2.5 Pro

种新型增强推理模式,在回应前会探索多种假设。

能够更有效地处理极其复杂的数学和编程问题。

在 2025 年美国数学奥林匹克竞赛(USAMO)和LiveCodeBench(一项针对竞赛级编程的高难度基准测试)测试都领先

Image
Read 14 tweets
May 6
写了一篇详细的教程

教大家如何生成这种一图流模型或者产品介绍宣传图

顺便教一下怎么用 Figma 修改从网页生成的图片 Image
如果等不及施工可以看这里:mp.weixin.qq.com/s/uQQ7R8rBUXZ6…
Read 13 tweets
Apr 22
Trae 更新 MCP 和 Agent 能力,这次更新强度拉满了

尤其是 Agent 支持组合 MCP 和提示词能搞各种花活

趁着这次更新我也写了一下我是如何进行 AI 编程(Vibe Coding)的

里面有很多小技巧,顺便教大家用 Trae

还有藏师傅的 15 条 Vibe Coding 建议先掏出来

详细教程和 Trae 更新介绍在下面👇 Image
先看一下Trae 发布了四大重磅功能

现在其能力已与 Cursor、Windsurf 看齐、甚至体验更胜一筹。例如可以自定义智能体,配合上MCP和prompt,能一次集结多个专属AI专家,为我所用。

智能体创建:支持基于提示词和MCP工具自定义智能体,@即可使用,不需要每次都输入复杂指令

智能工具(MCP):支持MCP,而且内置了常用的,只需要点击即可使用

更多上下文:新增联网搜索和文档集上下文理解能力,可以让AI搜索不懂的编码框架和文档了

个人/项目规则:支持配置个人规则和项目规则,不需要反复强调基础的编码要求Image
Image
Image
Image
如果懒得等🚧施工的可以先去看长文:mp.weixin.qq.com/s/ADHNyGj17b4U…
Read 11 tweets
Apr 15
兄弟们,我好像搞了个不得了的东西

自动获取你的位置、天气、当地新闻和你昨天收藏的文章,为你生成一个编排好的播客网页

你可以直接看内容也可以收听为你定制的播客

有朋友感兴趣的话我找时间写写
现在人人都可以自定义自己的 Agents 了,MCP 铺开以后想象力非常大
主要是这玩意使用门槛低到邪门,我就用了一句话,也没好好写提示词
Read 4 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(