歸藏(guizang.ai) Profile picture
Jun 19, 2023 13 tweets 9 min read Read on X
AIGC Weekly #26更新了,AI 领域沉寂了一个月之后终于有了一些新东西。本期主要内容有:

• Open AI 大动作,模型更新、函数调用、费用降低
• Meta Voicebox,一个全能语音生成模型
• Midjourney 最新的工作报告进展
• 谷歌的AI试衣模型
• Stable Diffusion稳定生成视频的突破

下面是详细信息🧵 Image
🥰本周精选:

Open AI 上周三发布了一大批模型相关的更新,包括了GPT-4和3.5的新版本模型,模型都支持函数调用以及关于模型 费用的调整: openai.com/blog/function-…
Meta 最近瞄准了除了大语言模型之外的其他媒体生成式模型开始发力,比如上周推出了 Voicebox,一个全能语音生成模型:ai.facebook.com/blog/voicebox-…
上周Midjourney工作时间官方的一些消息,比较重要的有:V6 相关信息、V5.2 相关信息、移动和 web 客户端等:

谷歌前两天发了一个AI试衣模型 TryOnDiffusion,想解决的是用户提供一张自己的全身照,就可以获得自己穿上对应服装的样子:blog.google/products/shopp…
上周发布的这个方案看起来很大程度解决了SD 生成视频的闪烁和稳定性问题:anonymous-31415926.github.io Image
⚒️产品推荐:

Framer AI :AI 帮你创建网页:framer.com/ai

Foreplay 2.0:大量制作高转化率的 Facebook 和 TikTok 广告:foreplay.co

腾讯智影:腾讯推出的 AI 画图应用:zenvideo.qq.com/image/create Image
Locofy:利用AI 和设计系统直接将设计稿转换为前端代码:locofy.ai

BeforeSunset:AI 驱动的 To-Do 应用:beforesunset.ai

Spell AI:AI 自动完成你安排的任务:spell.so

Freeflo:一个精美的 AI 生成图片素材库附带有提示词:freeflo.ai Image
Hotjar AI for surveys:AI 帮助创建调研问卷和分析:hotjar.com/product-ai-sur…

Vercel 推出了 AI SDK加速构建 AI 应用的过程:vercel.com/blog/introduci…

Millie:AI交友助手:meetmillie.app

Lancey:产品增长平台,快速启动PLG实验:trylancey.com Image
Octopulse AI:AI 驱动的用户增长分析平台:octopulse.ai

Writesonic:AI 辅助你撰写品牌宣传文章:writesonic.com/ai-article-wri…

Logo livery:AI 生成 LOGO:logolivery.ai

Obviously AI:无需编写代码即可构建AI模型的工具:obviously.ai Image
🔬精选文章:

欧盟人工智能法案的介绍:forbes.com/sites/forbeseq…

ChatGPT 代码解释器插件对财务和金融从业者的影响:every.to/napkin-math/op…

第一个基于 Yann LeCun 对更像人类 AI 的愿景的 AI 模型:ai.facebook.com/blog/yann-lecu… Image
LLM的不同发展路径:interconnects.ai/p/llm-developm…

成规模的 AI 领域市场地图:alexsandu.substack.com/p/market-map-g…

Reddit实际上是OpenAI的护城河:cyberdemon.org/2023/06/14/red…

用长期记忆增强语言模型:huggingface.co/papers/2306.07… Image
FinGPT:开源金融 LLM:arxiv.org/abs/2306.06031

LLM 输出内容水印的可靠性:arxiv.org/pdf/2306.04634…

Transformer模型调研:arxiv.org/abs/2306.07303

TAPIR:使用每帧初始化和时间细化跟踪任何点:arxiv.org/abs/2306.08637 Image
感谢大家看到这里,在此我也想给大家介绍一下有趣的内容和信息,如果你也觉得有意思的话可以私信我或者给我发邮件投稿。 订阅周刊:op7418.zhubai.love/posts/22825313…

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏(guizang.ai)

歸藏(guizang.ai) Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

Jan 22
搞了一个牛皮 Skills !

从任何 Youtube 视频链接剪辑为带有双语字幕的短视频和发布文案!

一键完成火爆 Youtube 视频的拆解和发布。

- 自动下载视频和原始字幕
- 自动分析总结字幕并对视频进行分段
- 选择需要剪辑的具体分段
- 翻译已选分段对应多语言字幕
- 将双语字幕烧录进已剪辑视频
- 生成社交媒体配对发布文案
安装及项目地址:

github.com/op7418/Youtube…
之前推荐用 Claude Code+yt-dlp 下载视频,很多人嘲讽说有点脱裤子放屁。

其实是这个 Skills 流程的前置探索,哈哈
Read 7 tweets
Sep 13, 2025
用 Lovart&Seedream 4.0 搞了一套超级牛皮的提示词!

可以将任何文案转换为成套的小红书图文,而且可控性极强,你可以调整任何一页的文案

基本上可以说是自媒体图文生成的终极方案了

👇下面是具体的教程: Image
如果你懒得等施工🚧可以在这里看长文:

mp.weixin.qq.com/s/FcTi0L8RSB5-…
Lovart前天开启了超级优惠活动:

9.10-9.20 Nano Banana 和 Seedream 4.0 模型免费用不扣积分

9.20 前开通基础(Basic)会员的,全年不限量免费用 Seedream4.0 & NanoBanana 两个模型

同时 Veo3 模型全系打三折,Pro+ 会员可灵和 hailuo 模型 20 号以前免费用

最近大家估计都发现了给用户让利才是最好的宣传,哈哈。
Read 16 tweets
Sep 7, 2025
用即梦 (Seed dream) 4 图像模型给自己做一个非常有质感的头像

这还原的也太好了,关键的 ID 要素都还原了,而且有那种非常有质感的笔触效果

提示词在下面👇 Image
提示词:参考图一的风格和样式为图2的角色生成一个图标,图标下方的文字应该为“guizang”

垫了下这个画头像老哥的图,注意自己玩可以不要盈利哈,尤其是垫图这种方式
也可以给你喜欢的游戏或者动漫角色画

优化后的提示词:参考图1的风格和样式为图2的角色生成一个图标,同时只要参考图2的头部位置,像一个头像图标,图标下方的文字应该为“Jinx” Image
Read 5 tweets
Sep 2, 2025
卧槽

今天就一顿捣鼓解决了 Nano Banana 最恶心的一个问题

你现在可以自定义他生成和修改后的图片比例了

👇下面是详细教程: Image
用 Nano Banana 多的朋友可能发现了,就是 Nano Banana 在有多张图片输入的时候,输出图的比例会跟其中一张相同,只不过这个过程很不可控。

藏师傅经过一顿科研发现,你可以用这个方法重新跑一次拯救你的旧图,而且新生成的图片也可以再跑一次重新定义生成比例。
我们需要两张图片来完成这个任务:

首先肯定是你之前生成的结果图,或者是你从其他地方获取的图片只是想更改比例也可以的。

比如我前几天做的这个 AI 书法舞女,由于书法字体每张截图都不一样大,导致生成的图片大小也不一样,很烦,为了生成视频我还得自己裁切,这样就容易丢失信息。 Image
Read 10 tweets
Aug 30, 2025
大聪明(赛博禅心)刚才发了个 Nano Banana 一图读懂XXX的提示词

非常适合用来学习和解释一些概念,浅显易懂

但他那个是针对 Lovart 搞的,我优化了一下,现在单独用Nano Banana也可以稳定生成,而且排版更加一致

下面👇是提示词 Image
Image
Image
Image
提示词:

Help me generate multiple 16:9 doodle-style images to explain the concept of "futures" to middle school students. The images should have a consistent colorful, thick-pencil hand-drawn style, be rich in information, feature English text, use solid color backgrounds, have outlines around the cards, and include uniform titles, similar to a PowerPoint presentation.
上面中文部分是我自己figma排的,需要中文的话可以用图片Vibe Coding一下
Read 5 tweets
Aug 26, 2025
开个帖子记录一下 Gemini 2.5 Flash Image 模型我发掘的一些用法,会持续更新,建议收藏

首先这个模型支持多图参考,为了你提示词好写,你可以给多张图片加上标记

比如这里就是 A 的背景、B 的沙发以及 C 的人物 Image
ID 保持真的很牛批,比如让藏师傅变瘦 Image
Image
这国内的美颜相机、醒图之类的难了啊,现在做这类产品直接提示词就行
Read 30 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(