歸藏(guizang.ai) Profile picture
May 15, 2023 19 tweets 14 min read Read on X
AIGC Weekly #21更新了,本期主要介绍了谷歌 I/O发布会的相关内容以及Anthropic和Open AI的一些消息还有上周一些产品推荐和值得阅读的文章,本期内容里面还有ChatDOC提供的会员福利,领取方式在下面周刊的详细信息里op7418.zhubai.love/posts/22697280… Image
🥰本周精选:

Google I/O发布会相关信息汇总:blog.google/technology/ai/…

首先是谷歌的自然语言模型PaLM 2,值得注意的是PaLM 2模型在各种规模上都提供出色的基础功能,包括名为Gecko的模型,能够在移动设备上运行,即使在离线状态下也可以支持交互式应用。

blog.google/technology/ai/… Image
接下来是AI搜索引擎Bard,Bard正在扩大全球访问范围,引入更多语言并结束候补名单。还将推出类似插件的功能。blog.google/technology/ai/…

谷歌还推出了基于谷歌搜索的一系列AI增强功能,从而为用户提供更多的信息和上下文。现在只对美国开放。labs.google.com/search/ Image
谷歌还推出了基于谷歌搜索的一系列AI增强功能,从而为用户提供更多的信息和上下文。现在只对美国开放。labs.google.com/search/ Image
其他的谷歌传统应用于AI结合的功能:
• Gmail推出了"Help me write"功能,用户只需输入简单指示,AI即可自动草拟邮件。
• Google Maps推出了新的沉浸式视图功能,用户可以在出发前预览整个旅程。
• Google Photos将推出Magic Editor功能,用户可以调整照片中的元素位置和光照效果 Image
• Android 系统会在你使用短信APP时增加AI功能帮你润色你的对话。
• 还推出了AI图片检测工具,通过搜索图片在谷歌搜索引擎最早出现的时间来判断。
• 推出了一款文本转音乐的AI工具MusicLM,该工具可以将用户的文本描述转化为独特的音乐作品。试用aitestkitchen.withgoogle.com/experiments/mu… Image
Anthropic已经把Claude的上下文窗口扩展到10万文本标记,大概七万五千个字符。这个功能将首先开放给有API权限的的用户。anthropic.com/index/100k-con…

Poe率先支持了这个能力,目前只有Web版本支持:poe.com/Claude-instant… Image
Open AI发布了新研究,使用 gpt4 来标记 gpt2 中的所有 307,200 个神经元,并用简单的英语描述每个神经元在模型中所扮演的角色:openai.com/research/langu…

Open AI还宣布了将会在这周向所有Plus用户全量开放插件的使用权限,UI也进行了更新:help.openai.com/en/articles/68… Image
Meta 开源了一个名为 Image Bind 的 AI 模型,这是第一个能够同时绑定来自六种模式的数据的 AI 模型:imagebind.metademolab.com

HuggingFace Transformers Agent,它使编码 LLM 能够动态组合其他 HF 模型以解决多模态任务:

huggingface.co/docs/transform… Image
⚒️产品推荐:

ChatDOC:与文档聊天,通过引用的来源获得即时答案:chatdoc.com

Boring Report:AI新闻降噪:boringreport.org

YOYA.ai:无代码生成AI应用:yoya.ai

Kadoa:AI驱动的内容爬取工具:kadoa.com Image
LingoSync:AI视频翻译:lingosync.ai

PuddlTrack:Open AI API监控工具:puddl.io

Help.center:AI客服构建工具:help.center

Teaser AI:AI约会应用:apps.apple.com/us/app/teaser-… Image
Dify:@goocarlos 开发的无代码LLM应用构建:dify.ai

Airtable 发布了自己的AI能力:airtable.com/product/ai

Raycast AI 正式向所有人公开:raycast.com/pro?ref=produc…

Scribe AI:AI流程管理工具:get.scribehow.com/ai-scribe/ Image
Zmo:AI商品背景替换工具:zmo.ai/ai-background-…

TOTAL CRAP:完全由AI编写的杂志:mcsweeneys.net/articles/intro… Image
🔬精选文章:

有关LLM代理工作原理:

生成式人工智能简介-Google:

OpenAI 的开发者关系负责人访谈:

Building AI 谷歌出品的AI课程:learndigital.withgoogle.com/digitalgarage/… Image
为什么大型语言模型会产生幻觉-IBM课程:

构建 ML 基础设施 - 采访 Aditya Nambiar Meta前技术主管:applyingml.com/mentors/aditya…

Meta 推出了一款名为 AI 沙盒的新型生成式 AI 广告工具:techcrunch.com/2023/05/11/met… Image
这位 23 岁的 Snapchat 明星可以成为你的 AI 女朋友——只要付出代价:decrypt.co/139633/snapcha…

GPT-4 的迷宫导航:深入研究 ReAct Agent 和 LLM 的思想:ekzhu.medium.com/gpt-4s-maze-na… Image
在 Langchain 中计划和执行代理,以进行更复杂的长期规划:blog.langchain.dev/plan-and-execu…

FrugalGPT:如何在降低成本和提高性能的同时使用大型语言模型:arxiv.org/abs/2305.05176 Image
💼招聘信息:

Poe招聘远程iOS和Android开发工程师:jobs.ashbyhq.com/quora/300b6c66…

Open AI招聘产品设计师:openai.com/careers/produc… Image
感谢大家看到这里,在此我也想给大家介绍一下有趣的内容和信息,如果你也觉得有意思的话可以私信我或者给我发邮件投稿。 再次感谢ChatDOC提供的会员。订阅周刊:op7418.zhubai.love/posts/22697280…

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏(guizang.ai)

歸藏(guizang.ai) Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

Mar 31
作为收集控,信息检索一直困扰我。

AI出现解决了查找问题,但AI知识库新难点变成了:如何快速导入已有知识和解析多种文件类型?

纳米AI通过非常骚的方式解决了这两大痛点。

👇下面是详细的介绍,其他做类似产品的人也可以参考 Image
快速导入

在导入数据的时候他们充分思考了我们日常工作的知识来源和沉淀的位置。

在个人知识库点添加内容你会发现,除了大家都会做的文件上传和网页解析之外,他们还做了直接导入收藏夹。

相信很多普通用户自己是没有专门的内容收藏工具的,基本都是建一个收藏夹文件然后将链接存进去,现在直接就能批量导入和解析。

而且还支持深度解析,不止可以处理网页的文字内容,里面的图片和图表内容也可以变成LLM可以理解的方式存储下来。Image
快速导入 2

上面说了常规的网页渠道外,他们还敏锐的发现了两个重要的打工人存放资料的渠道并且做了适配,那就是微信和桌面。

你可以快速的选择自己的微信传输的文件和桌面存放的文件。

微信这个就别说了,我这个差生有这么多的工具,在着急的时候依然是把文档和内容往微信的文件传输助手里面扔。

至于桌面知识库,有人说上面上传本地文件不是可以选电脑的任何位置吗,为什么还要单独搞一个桌面知识库。
问这话的朋友一看你就对我们广大打工人的计算机水平过于自信了。

我前段时间就说过相当多的上班族其实并不会用电脑,他们完全没有分区和硬盘的概念,或者图省事所有的常用文件都在桌面上。

做这个功能的产品对白领工作者的工作状态有相当深的认识。Image
Read 9 tweets
Mar 25
来了!一套提示词帮你实现小红书、公众号封面自由

而且 Deepseek V3 也能用

这套提示词是模块化设计的,风格部分与其他部分解耦,可以说是产品化方案了。

👇下面是具体的使用方式 Image
不想等施工🚧的可以看这里:mp.weixin.qq.com/s/OFCgFrXNQgIT…
而且昨晚 Deepseek V3 0324 发布之后,发现 V3 0324 也可以实现跟 Claude 3.7 差不多的效果

另外微信公众号提示词生成的风格会一次性生成矩形和正方形的封面,你只需要一次上传就行,然后在公众号后台裁切选择合适的部分。 Image
Read 20 tweets
Mar 20
我写了一套提示词帮大家从文档生成可视化网页,但对很多人来说还是有点难

主要是因为:
想要效果好必须用 Claude 3.7
还得将需要整理的内容复制或者整理到文档里面

当时发出来也希望大佬们可以搞个产品给大家用

发现秘塔已经搞定了,能一键生成可视化网页,非常强

下面是介绍和使用方法👇 Image
比如我最近一直在看 MCP 相关的内容,秘塔搭载了 Deepseek R1 的研究模式非常强大,搜索的结果非常全面。

但以往的话这种纯文本内容和表格其实不太方便理解,尤其是一些有阅读障碍的人,看到密密麻麻的字已经开始头疼了。

这个时候只需要点击回答底部的「生成互动网页按钮」就能打开一个新世界。

可以看到现在搜索结果已经变成了一个非常条理的网页,不再是一条线传下来全是文字,每个标题和要点的关系都很清晰还加上了图标辅助定位和理解。

相信相较于上面的文字大家都会更喜欢这个结果。
Image
Image
也不只是秘塔的搜索结果才能生成网页,他还能读取你提供链接里的文章内容生成网页。

只需要输入网页链接后点击「打开互动网页」的按钮就行,这下真一键了。

生成过程的动效也很炫酷,哈哈,看着滚动的代码的感觉很爽。

这里就是基于我的公众号生成的网页,明显更加美观,而且秘塔生成的网页也是可以一键分享的,点击右上角的「分享」按钮就可以获取到链接。Image
Image
Read 4 tweets
Mar 14
发现夸克推出了 AI 超级框功能,顺便试了一下,这玩意现在已经这么强了吗?

你可以直接提出你的问题和需求,不需要思考比如该选什么模型和用什么工具这些本来不用你思考的问题。

直接帮你调用夸克非常完善的工具基建完成任务,甚至可以组合多个工具完成。

👇下面是具体的介绍和案例: Image
解决这个事情其实挺难的,因为需要模型去调用各种 Agents 工具完成任务。需要几个条件:

首先这个公司需要有各种基础工具的基建,比如健康类知识、比如办公软件基建;

另外需要有丰富且强大的模型生态,模型能力强但是无法调用工具也无法完成这些任务。

如果用这些条件一排除你会发现能做好这些事情的可能居然只有阿里了。

Qwen 系列模型目前非常强大和完善,无论是多模态还是推理都非常强,而且最新的qwq 32B 在支持推理的基础上还能调用工具。

夸克很早就在布局各种工具和信息,比如专门的健康类搜索,都是医生和药典信息,还有 AI PPT 功能模板丰富而且非常美观,里面有整整一页的各种工作和学习工具。
首先我们用的最多的还是 AI 搜索能力:

夸克的 AI 搜索一些专业领域都做了专门的优化,模型一旦识别到你的意图,就会在专门的可信内容搜索后整理结果。

健康内容,他会直接搜索认证医生和药典的答案,而且非常清晰的标注了来源

影视类型的内容还会有专门的展示样式,能看到评分和详细介绍

学术内容会从权威学术网站直接搜索结果,帮你避免了 AI 自己和应用来源的幻觉问题,哪怕你没有启用深度搜索,在设计复杂计算和推理的问题上也会自己调用Image
Read 5 tweets
Mar 5
最近很多人问我

为啥我用 Claude 写的应用就没那么漂亮?

所以教大家一些非常简单的技巧

用上了以后你也能搞定这么漂亮的界面

👇下面是具体的技巧和完整提示词
完整内容这里,懒得等施工可以看:mp.weixin.qq.com/s/tUOAfd4OI56Q…
第一个技巧:

不用非得用语言来描述你想要的界面样式,可以去一些设计平台找一些你喜欢的设计稿将图片上传到图片让模型参考。

如果你不知道去哪找的话,国内推荐站酷、海外的话推荐 Dribbble 和 Layers。

在跟 Claude 说的时候就可以忽略那些不好描述的地方,重点描述静态图片无法表现的部分,比如下面的这个卡片组件。

我就让 Claude 注意交互的动画和输入框聚焦之后的渐变动画上,界面内容和风格就让他按图片生成。Image
Read 8 tweets
Mar 5
AI 大神 Andrej Karpathy 教你使用大语言模型

这次不讲原理,真的是个人都能看懂了

基本详细介绍了目前 LLM 最常见的几个功能的用法

比如总结内容、Python 解释器、Claude Artifacts、Cursor、NotebookLM、图片和视频生成等

翻译了一下视频,👇下面也有文字总结
总结书籍章节和文档

目的: 快速理解书籍、章节或文档的内容,尤其是复杂或较旧的文本。

工具: LLM,如 ChatGPT 或 Claude。

他的使用方法:将文本内容复制并粘贴到 LLM 中。
要求 LLM 总结内容。
在阅读全文之前,将摘要用作起点。
在阅读时提出问题以澄清理解。

益处:提高记忆保持率和理解力。
使复杂文本更易于访问。
鼓励参与具有挑战性的材料。
用于复杂计算的 Python 解释器

目的: 执行超出简单心算的计算,利用 LLM 编写和执行代码的能力。

工具: 带有 Python 解释器的 ChatGPT。

他的使用方法:提出对于心算来说过于复杂的数学问题。
ChatGPT 使用其 Python 解释器工具编写并运行 Python 程序来解决问题。
Python 程序的运行结果返回给 LLM,然后由 LLM 将其呈现给用户。

益处:复杂计算的准确结果。
克服了 LLM 内部“基于记忆”计算的局限性。

注意: 不同的 LLM 具有不同的工具集。有些可能无法访问 Python 解释器或类似工具,这可能会导致复杂任务的结果不准确。
Read 16 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(