歸藏(guizang.ai) Profile picture
May 15, 2023 19 tweets 14 min read Read on X
AIGC Weekly #21更新了,本期主要介绍了谷歌 I/O发布会的相关内容以及Anthropic和Open AI的一些消息还有上周一些产品推荐和值得阅读的文章,本期内容里面还有ChatDOC提供的会员福利,领取方式在下面周刊的详细信息里op7418.zhubai.love/posts/22697280… Image
🥰本周精选:

Google I/O发布会相关信息汇总:blog.google/technology/ai/…

首先是谷歌的自然语言模型PaLM 2,值得注意的是PaLM 2模型在各种规模上都提供出色的基础功能,包括名为Gecko的模型,能够在移动设备上运行,即使在离线状态下也可以支持交互式应用。

blog.google/technology/ai/… Image
接下来是AI搜索引擎Bard,Bard正在扩大全球访问范围,引入更多语言并结束候补名单。还将推出类似插件的功能。blog.google/technology/ai/…

谷歌还推出了基于谷歌搜索的一系列AI增强功能,从而为用户提供更多的信息和上下文。现在只对美国开放。labs.google.com/search/ Image
谷歌还推出了基于谷歌搜索的一系列AI增强功能,从而为用户提供更多的信息和上下文。现在只对美国开放。labs.google.com/search/ Image
其他的谷歌传统应用于AI结合的功能:
• Gmail推出了"Help me write"功能,用户只需输入简单指示,AI即可自动草拟邮件。
• Google Maps推出了新的沉浸式视图功能,用户可以在出发前预览整个旅程。
• Google Photos将推出Magic Editor功能,用户可以调整照片中的元素位置和光照效果 Image
• Android 系统会在你使用短信APP时增加AI功能帮你润色你的对话。
• 还推出了AI图片检测工具,通过搜索图片在谷歌搜索引擎最早出现的时间来判断。
• 推出了一款文本转音乐的AI工具MusicLM,该工具可以将用户的文本描述转化为独特的音乐作品。试用aitestkitchen.withgoogle.com/experiments/mu… Image
Anthropic已经把Claude的上下文窗口扩展到10万文本标记,大概七万五千个字符。这个功能将首先开放给有API权限的的用户。anthropic.com/index/100k-con…

Poe率先支持了这个能力,目前只有Web版本支持:poe.com/Claude-instant… Image
Open AI发布了新研究,使用 gpt4 来标记 gpt2 中的所有 307,200 个神经元,并用简单的英语描述每个神经元在模型中所扮演的角色:openai.com/research/langu…

Open AI还宣布了将会在这周向所有Plus用户全量开放插件的使用权限,UI也进行了更新:help.openai.com/en/articles/68… Image
Meta 开源了一个名为 Image Bind 的 AI 模型,这是第一个能够同时绑定来自六种模式的数据的 AI 模型:imagebind.metademolab.com

HuggingFace Transformers Agent,它使编码 LLM 能够动态组合其他 HF 模型以解决多模态任务:

huggingface.co/docs/transform… Image
⚒️产品推荐:

ChatDOC:与文档聊天,通过引用的来源获得即时答案:chatdoc.com

Boring Report:AI新闻降噪:boringreport.org

YOYA.ai:无代码生成AI应用:yoya.ai

Kadoa:AI驱动的内容爬取工具:kadoa.com Image
LingoSync:AI视频翻译:lingosync.ai

PuddlTrack:Open AI API监控工具:puddl.io

Help.center:AI客服构建工具:help.center

Teaser AI:AI约会应用:apps.apple.com/us/app/teaser-… Image
Dify:@goocarlos 开发的无代码LLM应用构建:dify.ai

Airtable 发布了自己的AI能力:airtable.com/product/ai

Raycast AI 正式向所有人公开:raycast.com/pro?ref=produc…

Scribe AI:AI流程管理工具:get.scribehow.com/ai-scribe/ Image
Zmo:AI商品背景替换工具:zmo.ai/ai-background-…

TOTAL CRAP:完全由AI编写的杂志:mcsweeneys.net/articles/intro… Image
🔬精选文章:

有关LLM代理工作原理:

生成式人工智能简介-Google:

OpenAI 的开发者关系负责人访谈:

Building AI 谷歌出品的AI课程:learndigital.withgoogle.com/digitalgarage/… Image
为什么大型语言模型会产生幻觉-IBM课程:

构建 ML 基础设施 - 采访 Aditya Nambiar Meta前技术主管:applyingml.com/mentors/aditya…

Meta 推出了一款名为 AI 沙盒的新型生成式 AI 广告工具:techcrunch.com/2023/05/11/met… Image
这位 23 岁的 Snapchat 明星可以成为你的 AI 女朋友——只要付出代价:decrypt.co/139633/snapcha…

GPT-4 的迷宫导航:深入研究 ReAct Agent 和 LLM 的思想:ekzhu.medium.com/gpt-4s-maze-na… Image
在 Langchain 中计划和执行代理,以进行更复杂的长期规划:blog.langchain.dev/plan-and-execu…

FrugalGPT:如何在降低成本和提高性能的同时使用大型语言模型:arxiv.org/abs/2305.05176 Image
💼招聘信息:

Poe招聘远程iOS和Android开发工程师:jobs.ashbyhq.com/quora/300b6c66…

Open AI招聘产品设计师:openai.com/careers/produc… Image
感谢大家看到这里,在此我也想给大家介绍一下有趣的内容和信息,如果你也觉得有意思的话可以私信我或者给我发邮件投稿。 再次感谢ChatDOC提供的会员。订阅周刊:op7418.zhubai.love/posts/22697280…

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏(guizang.ai)

歸藏(guizang.ai) Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

Mar 12
Cognition发布首位AI软件工程师Devin,这个演示相当惊艳。

Devin 是一个自主Agents,它通过使用自己的 shell、代码编辑器和网络浏览器来解决工程任务。

Devin成功通过了知名人工智能公司的实际工程面试,甚至还在 Upwork 上完成了实际工作。

Devin 在无辅助情况下正确解决了 13.86% 的问题,远远超过了之前最先进模型 1.96% 的无辅助和 4.80% 的辅助性能。

它可以学习如何使用不熟悉的技术,可以为成熟的生产资源库做出贡献,可以训练和微调自己的人工智能模型,甚至试着在 Upwork 上给 Devin 提供真实的工作,它也能完成。
这里有关于Devin的详细介绍:
cognition-labs.com/blog
Devin 通过自主学习对应文章生成图片的案例
Read 4 tweets
Feb 29
之前推荐过的国内☁️云服务平台揽睿星舟最近上线了 ComfyUI,他们是真想把这玩意的云服务做好,很适合入门学习。

把常用的 ComfyUI 插件和模型都上传上去了,我把我自己常用的一个相对复杂的 Animatediff 工作流拖进去发现所有的插件和模型都是 OK 的,一键运行。

👇下面也会有启动的教程和地址 Image
你可以在这里使用注册和使用揽睿星舟,通过这个链接会有优惠券,如果你只是想体验的话配合无门槛优惠券充值一块钱就可以用:

我们开始简单的使用教程lanrui-ai.com/register?invit…
登录之后可以点击左侧导航的工作空间,然后点击右侧创建工作空间。 Image
Read 9 tweets
Feb 21
见鬼了,谷歌居然开源LLM模型了,Meta要慌了。

Gemma 采用了和Gemini一样技术的开源LLM,同时质量也比同规模的模型要强。

下面是一些要点:

◈ 两种尺寸的模型权重:Gemma 2B和Gemma 7B。每种尺寸都有预训练和指导调整的变体。

◈ 一个生成式人工智能工具包,为使用Gemma创建更安全的人工智能应用提供指导和必要工具。

◈ 通过原生Keras 3.0为所有主要框架(JAX、PyTorch和TensorFlow)提供推理和监督微调(SFT)的工具链。

◈ 准备好的Colab和Kaggle笔记本,以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT等流行工具的集成,使得开始使用Gemma变得非常容易。

◈ 预先训练和经过调整的Gemma模型可以在您的笔记本电脑、工作站或Google Cloud上运行,并可以轻松部署到Vertex AI和Google Kubernetes Engine(GKE)。

◈ 跨多个人工智能硬件平台的优化确保了行业领先的性能,包括NVIDIA GPU和Google Cloud TPU。

◈ 允许所有组织进行负责任的商业使用和分发,无论规模大小。

◈未来还会发布Gemma更大模型变体。

了解更多:blog.google/technology/dev…Image
Gemma模型与Gemini共享技术和基础设施组件。

这使得Gemma 2B和7B能够在与其他开放模型相比实现最佳性能。

Gemma在关键基准测试中超越了明显更大的模型。

详细的技术报告在这里:storage.googleapis.com/deepmind-media…
你可以在这里下载和使用Gemma:
kaggle.com/models/google/…
Image
Read 6 tweets
Feb 21
Open AI传奇研究员Andrej Karpathy的新课,教你理解和构建GPT Tokenizer。

他可以把相当复杂的LLM概念用非常好理解的方式讲出来。希望了解LLM的强烈建议听一下他的课,包括一些历史课程。

用GPT-4翻译了一下这节课,感兴趣可以听一下。字幕文件下载和历史课程会放在下面⬇️
补充一下视频介绍:

分词器是大语言模型(LLM)处理流程中一个独立且关键的环节。它们有专属的训练数据集、采用特定的训练算法——字节对编码(Byte Pair Encoding),训练完成后,分词器能够执行两个核心功能:encode() 函数将普通文本字符串转换为词元,而 decode() 函数则能将词元还原为原始文本字符串。在这场讲座中,我们将一步步揭开 OpenAI GPT 系列分词器的构建过程。

我们将发现,许多大语言模型(LLM)表现出的异常行为和问题,其实都源于标记化(tokenization)这一环节。我们会针对这些问题进行详细讨论,探究标记化为何成为问题的关键所在,以及为什么最理想的情况是有人能够找到办法,完全去除这一处理阶段。Image
两个月前他的另一节课《大语言模型简介》非常浅显易懂。

解释了大语言模型的训练过程以及什么是多模态,最后最重要的是LLM的发展方向以及发展路径。

如果你不是专业的机器学习出身又想了解LLM的话这节课是讲的最好的,希望看看。

我人工校对的视频也在后面网盘链接里。
Read 4 tweets
Dec 12, 2023
写个如何用 Ollama 在 Mac 本地跑 LLM,并且用在 Obsidian 上处理自己的笔记和内容的小教程。视频是具体的演示,我把等待时间剪掉了。
我们开始具体的教程🧵:
首先需要去Ollama的网站下载安装包, 下载完之后直接安装然后打开就行。 ollama.ai
Image
之后我们可以在他的 Github 上找到所有的命令,选择一个你需要的复制那个命令,找到你电脑里终端这个软件,然后粘贴刚才的命令,然后回车。比如:ollama run mistral
Github 地址: github.com/jmorganca/olla…
Image
Read 8 tweets
Sep 22, 2023
这个研究有点强的,我们可能获得了另外一种增强Stable Diffusion控制的方法,它允许你使用富文本书写提示词影响画面

比如指定某个提示词的颜色,例如提示词中有长发这个单词,然后你把长发的文字颜色改成了粉色,那么生成图像的头发颜色就会变成粉色

下面我们来看一下它支持的富文本格式和原理🧵
首先你可以通过字体颜色控制生成对象的颜色,比如下面这张图Hair头发的字体颜色被改成粉色的时候生成图像的头发颜色就会变为粉色 Image
然后你可以改变对应提示词单词的字体来赋予图像对应的风格,这个就有点意识流了,全看模型对这个字体的感知,比如下面这这张图的guitar吉他的字体如果是比较放松的就会生成彩色的吉他,如果是古朴的手写体吉他就比较有年代感。 Image
Read 6 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(