歸藏(guizang.ai) Profile picture
Apr 17, 2023 8 tweets 8 min read Read on X
AIGC Weekly #17更新了,本期主要介绍了AutoGPT的相关内容、SDXL模型的测试以及ContorlNet的更新等一堆非常值得阅读的内容,这周开源社区疯狂发力,好多开源项目。下面是上周一些行业动态和产品推荐,更多详细的内容可以去图里的竹白查看:op7418.zhubai.love/posts/22597470… Image
🥰本周精选(1):

AutoGPT:AI自动执行命令完成任务,这部分有点长早上单独发了一条,可以来这里看:

Stable Diffusion XL模型扩大测试范围,下面是Stability AI说的一些模型特点:

更强的的照片逼真度能力
增强的图像合成和面部生成… twitter.com/i/web/status/1…
🥰本周精选(2):
Stable Diffusion插件ContorlNet更新1.1版本:github.com/lllyasviel/Con…

还新增了几个模型,目前模型总数达到了14个,新增了4个模型。可能会给SD带来新的玩法主要新增模型介绍:
Openpose增加了对面部和手部的支持,可以选择只针对身体生效,还是对身体+面部+手部生效
新增Content… twitter.com/i/web/status/1… Image
⚒️产品推荐(1):

特赞发布自己的 AI 资产管理产品 DAM.GPT:damgpt.tezign.com
SnackPrompt:提示词共享社区:snackprompt.com
HeroPage:提示词分享社区:hero.page
Builder.io:用AI生成设计,并输出为代码:builder.io/blog/ai-figma
X… twitter.com/i/web/status/1… ImageImageImageImage
⚒️产品推荐(2):

Tripnotes:AI帮你指定旅行计划:tripnotes.ai/app
RASK:快速将你的视频本地化翻译为60种语言:rask.ai
AI Assist™ :AI帮助生成合同:ironcladapp.com/blog/new-legal…
Gradio Web UI:支持数十种开源语言模型的Web UI:github.com/oobabooga/text…twitter.com/i/web/status/1… Image
🧑‍🎓学习资源:

使用ChatGPT创建一个公司的完整提示词模板:reddit.com/r/ChatGPT/comm…
如何利用AI和ChatGPT创建网页:
我试着卖了30天的AI艺术品--现实的结果:
🔬精选文章(1):

代理化的LLM将改变对齐(alignment)领域的格局:lesswrong.com/posts/dcoxvEhA…
开源语言模型现状:scalevp.com/blog/whats-up-…
Open AI发布了一个叫一致性模型的东西:techcrunch.com/2023/04/12/ope…
福布斯-2023的50家AI公司:forbes.com/lists/ai50
GPT-4… twitter.com/i/web/status/1… Image
🔬精选文章(2):

如何使用ChatGPT创建调查问卷 [应用案例]:blog.uxtweak.com/using-chatgpt-…
生成代理人:人类行为的交互式模拟:arxiv.org/pdf/2304.03442…
ChemCrow:使用大型语言模型增强化学工具:arxiv.org/abs/2304.05376twitter.com/i/web/status/1… Image

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏(guizang.ai)

歸藏(guizang.ai) Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

Apr 15
兄弟们,我好像搞了个不得了的东西

自动获取你的位置、天气、当地新闻和你昨天收藏的文章,为你生成一个编排好的播客网页

你可以直接看内容也可以收听为你定制的播客

有朋友感兴趣的话我找时间写写
现在人人都可以自定义自己的 Agents 了,MCP 铺开以后想象力非常大
主要是这玩意使用门槛低到邪门,我就用了一句话,也没好好写提示词
Read 4 tweets
Apr 9
上周我写 MCP 教程的时候说,希望有大厂可以搞个一键安装的 MCP 商店

没想到这一天来的这么快

阿里云百炼平台推出了业界首个全生命周期MCP服务

企业、开发者甚至个人用户可以一键部署 MCP 服务,可视化构建 Agents!

👇下面写个简单的教程,这下你肯定可以学会了: Image
阿里百炼具体特点有:

一键部署:提供一键部署、无需运维的MCP服务
超多 MCP 供给:内置了 MCP 市场默认提供了相当多官方的 MCP 和三方 MCP
低成本服务托管:业级MCP服务托管,函数计算资源动态启用,弹性按量付费
全链路工具兼容:在智能体和工作流中快速引用MCP服务
这里用两个例子给大家展示一下怎么用百炼的 MCP 服务构建自己的 Agents 应用:

用高德 MCP 查询当地天气之后让 AI 写个网页帮我们可视化的展示天气;

用 Firecrawl 和 Flomo MCP 自动查询和总结网页内容保存到你的 Flomo 变成笔记。
Read 9 tweets
Mar 31
作为收集控,信息检索一直困扰我。

AI出现解决了查找问题,但AI知识库新难点变成了:如何快速导入已有知识和解析多种文件类型?

纳米AI通过非常骚的方式解决了这两大痛点。

👇下面是详细的介绍,其他做类似产品的人也可以参考 Image
快速导入

在导入数据的时候他们充分思考了我们日常工作的知识来源和沉淀的位置。

在个人知识库点添加内容你会发现,除了大家都会做的文件上传和网页解析之外,他们还做了直接导入收藏夹。

相信很多普通用户自己是没有专门的内容收藏工具的,基本都是建一个收藏夹文件然后将链接存进去,现在直接就能批量导入和解析。

而且还支持深度解析,不止可以处理网页的文字内容,里面的图片和图表内容也可以变成LLM可以理解的方式存储下来。Image
快速导入 2

上面说了常规的网页渠道外,他们还敏锐的发现了两个重要的打工人存放资料的渠道并且做了适配,那就是微信和桌面。

你可以快速的选择自己的微信传输的文件和桌面存放的文件。

微信这个就别说了,我这个差生有这么多的工具,在着急的时候依然是把文档和内容往微信的文件传输助手里面扔。

至于桌面知识库,有人说上面上传本地文件不是可以选电脑的任何位置吗,为什么还要单独搞一个桌面知识库。
问这话的朋友一看你就对我们广大打工人的计算机水平过于自信了。

我前段时间就说过相当多的上班族其实并不会用电脑,他们完全没有分区和硬盘的概念,或者图省事所有的常用文件都在桌面上。

做这个功能的产品对白领工作者的工作状态有相当深的认识。Image
Read 9 tweets
Mar 25
来了!一套提示词帮你实现小红书、公众号封面自由

而且 Deepseek V3 也能用

这套提示词是模块化设计的,风格部分与其他部分解耦,可以说是产品化方案了。

👇下面是具体的使用方式 Image
不想等施工🚧的可以看这里:mp.weixin.qq.com/s/OFCgFrXNQgIT…
而且昨晚 Deepseek V3 0324 发布之后,发现 V3 0324 也可以实现跟 Claude 3.7 差不多的效果

另外微信公众号提示词生成的风格会一次性生成矩形和正方形的封面,你只需要一次上传就行,然后在公众号后台裁切选择合适的部分。 Image
Read 20 tweets
Mar 20
我写了一套提示词帮大家从文档生成可视化网页,但对很多人来说还是有点难

主要是因为:
想要效果好必须用 Claude 3.7
还得将需要整理的内容复制或者整理到文档里面

当时发出来也希望大佬们可以搞个产品给大家用

发现秘塔已经搞定了,能一键生成可视化网页,非常强

下面是介绍和使用方法👇 Image
比如我最近一直在看 MCP 相关的内容,秘塔搭载了 Deepseek R1 的研究模式非常强大,搜索的结果非常全面。

但以往的话这种纯文本内容和表格其实不太方便理解,尤其是一些有阅读障碍的人,看到密密麻麻的字已经开始头疼了。

这个时候只需要点击回答底部的「生成互动网页按钮」就能打开一个新世界。

可以看到现在搜索结果已经变成了一个非常条理的网页,不再是一条线传下来全是文字,每个标题和要点的关系都很清晰还加上了图标辅助定位和理解。

相信相较于上面的文字大家都会更喜欢这个结果。
Image
Image
也不只是秘塔的搜索结果才能生成网页,他还能读取你提供链接里的文章内容生成网页。

只需要输入网页链接后点击「打开互动网页」的按钮就行,这下真一键了。

生成过程的动效也很炫酷,哈哈,看着滚动的代码的感觉很爽。

这里就是基于我的公众号生成的网页,明显更加美观,而且秘塔生成的网页也是可以一键分享的,点击右上角的「分享」按钮就可以获取到链接。Image
Image
Read 4 tweets
Mar 14
发现夸克推出了 AI 超级框功能,顺便试了一下,这玩意现在已经这么强了吗?

你可以直接提出你的问题和需求,不需要思考比如该选什么模型和用什么工具这些本来不用你思考的问题。

直接帮你调用夸克非常完善的工具基建完成任务,甚至可以组合多个工具完成。

👇下面是具体的介绍和案例: Image
解决这个事情其实挺难的,因为需要模型去调用各种 Agents 工具完成任务。需要几个条件:

首先这个公司需要有各种基础工具的基建,比如健康类知识、比如办公软件基建;

另外需要有丰富且强大的模型生态,模型能力强但是无法调用工具也无法完成这些任务。

如果用这些条件一排除你会发现能做好这些事情的可能居然只有阿里了。

Qwen 系列模型目前非常强大和完善,无论是多模态还是推理都非常强,而且最新的qwq 32B 在支持推理的基础上还能调用工具。

夸克很早就在布局各种工具和信息,比如专门的健康类搜索,都是医生和药典信息,还有 AI PPT 功能模板丰富而且非常美观,里面有整整一页的各种工作和学习工具。
首先我们用的最多的还是 AI 搜索能力:

夸克的 AI 搜索一些专业领域都做了专门的优化,模型一旦识别到你的意图,就会在专门的可信内容搜索后整理结果。

健康内容,他会直接搜索认证医生和药典的答案,而且非常清晰的标注了来源

影视类型的内容还会有专门的展示样式,能看到评分和详细介绍

学术内容会从权威学术网站直接搜索结果,帮你避免了 AI 自己和应用来源的幻觉问题,哪怕你没有启用深度搜索,在设计复杂计算和推理的问题上也会自己调用Image
Read 5 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(