歸藏(guizang.ai) Profile picture
Jun 12, 2023 8 tweets 7 min read Read on X
AIGC Weekly #25更新了。本期主要内容有Meta 关于产品接入 AI 的规划、ChatGPT APP开始支持 iPad 和 Siri 等。上周一些产品推荐和值得阅读的文章。详细信息可以在链接里查看:op7418.zhubai.love/posts/22750100…

上周三也更新了一期,不过没有发精简版,感兴趣可以这里看上一期内容:op7418.zhubai.love/posts/22782792… Image
🥰本周精选:

Meta 宣布即将全面给自己旗下产品接入 AI 能力:

Meta发布了一个根据输入的文本生成音乐的工具MusicLM:huggingface.co/spaces/faceboo…

ChatGPT 开始支持 iPad 和 Siri 我做了一个快捷指令可以帮你更好的使用:icloud.com/shortcuts/0013… Image
⚒️产品推荐:

Clipdrop 发布类似 PS AI 的免费图像编辑工具:clipdrop.co/uncrop

Blobr:五分钟用任何 API 创建 ChatGPT 插件:blobr.io/api-gateway-ch…

Runway 的 Gen-2 正式开放测试:app.runwayml.com/video-tools/

TimeComplexity:代码复杂度计算器:timecomplexity.ai Image
Miero:借助 AI 创建引人入胜的课程:meiro.cc

Albus:AI 驱动的知识管理工具:albus.org

Granica:AI 效率平台,可降低存储和访问数据的成本:granica.ai

Show Me:为任何内容创建可视化解释的 ChatGPT 插件 Image
Synthesis Tutor:AI 驱动的数学辅导软件:synthesis.com/tutor

RayCast:提示词合集:prompts.ray.so/code

一个构建可控 AI 代理的框架:github.com/TransformerOpt… Image
🔬精选文章:

你需要知道的 28 个人工智能术语:dzone.com/articles/ai-gl…

Sam Altman在智源大会演讲全文:mp.weixin.qq.com/s/2e9mQYZ7TWaz…

查理·布鲁克 (Charlie Brooker) 让 ChatGPT 写了一部《黑镜》剧集,但它是“狗屎”:empireonline.com/tv/news/charli… Image
LlamaIndex 和 Transformers 的代理:medium.com/llamaindex-blo…

简单可控的音乐生成:huggingface.co/papers/2306.05…

AI 教育行业地图:medium.com/@LaurenceHolt/…

ChatGPT 插件没有 PMF:matt-rickard.com/chatgpt-plugin…

如何将Supabase与LlamaIndex集成:supabase.com/docs/guides/ai… Image
感谢大家看到这里,在此我也想给大家介绍一下有趣的内容和信息,如果你也觉得有意思的话可以私信我或者给我发邮件投稿。 订阅周刊:op7418.zhubai.love/posts/22800205…

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏(guizang.ai)

歸藏(guizang.ai) Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

Mar 12
Cognition发布首位AI软件工程师Devin,这个演示相当惊艳。

Devin 是一个自主Agents,它通过使用自己的 shell、代码编辑器和网络浏览器来解决工程任务。

Devin成功通过了知名人工智能公司的实际工程面试,甚至还在 Upwork 上完成了实际工作。

Devin 在无辅助情况下正确解决了 13.86% 的问题,远远超过了之前最先进模型 1.96% 的无辅助和 4.80% 的辅助性能。

它可以学习如何使用不熟悉的技术,可以为成熟的生产资源库做出贡献,可以训练和微调自己的人工智能模型,甚至试着在 Upwork 上给 Devin 提供真实的工作,它也能完成。
这里有关于Devin的详细介绍:
cognition-labs.com/blog
Devin 通过自主学习对应文章生成图片的案例
Read 4 tweets
Feb 29
之前推荐过的国内☁️云服务平台揽睿星舟最近上线了 ComfyUI,他们是真想把这玩意的云服务做好,很适合入门学习。

把常用的 ComfyUI 插件和模型都上传上去了,我把我自己常用的一个相对复杂的 Animatediff 工作流拖进去发现所有的插件和模型都是 OK 的,一键运行。

👇下面也会有启动的教程和地址 Image
你可以在这里使用注册和使用揽睿星舟,通过这个链接会有优惠券,如果你只是想体验的话配合无门槛优惠券充值一块钱就可以用:

我们开始简单的使用教程lanrui-ai.com/register?invit…
登录之后可以点击左侧导航的工作空间,然后点击右侧创建工作空间。 Image
Read 9 tweets
Feb 21
见鬼了,谷歌居然开源LLM模型了,Meta要慌了。

Gemma 采用了和Gemini一样技术的开源LLM,同时质量也比同规模的模型要强。

下面是一些要点:

◈ 两种尺寸的模型权重:Gemma 2B和Gemma 7B。每种尺寸都有预训练和指导调整的变体。

◈ 一个生成式人工智能工具包,为使用Gemma创建更安全的人工智能应用提供指导和必要工具。

◈ 通过原生Keras 3.0为所有主要框架(JAX、PyTorch和TensorFlow)提供推理和监督微调(SFT)的工具链。

◈ 准备好的Colab和Kaggle笔记本,以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT等流行工具的集成,使得开始使用Gemma变得非常容易。

◈ 预先训练和经过调整的Gemma模型可以在您的笔记本电脑、工作站或Google Cloud上运行,并可以轻松部署到Vertex AI和Google Kubernetes Engine(GKE)。

◈ 跨多个人工智能硬件平台的优化确保了行业领先的性能,包括NVIDIA GPU和Google Cloud TPU。

◈ 允许所有组织进行负责任的商业使用和分发,无论规模大小。

◈未来还会发布Gemma更大模型变体。

了解更多:blog.google/technology/dev…Image
Gemma模型与Gemini共享技术和基础设施组件。

这使得Gemma 2B和7B能够在与其他开放模型相比实现最佳性能。

Gemma在关键基准测试中超越了明显更大的模型。

详细的技术报告在这里:storage.googleapis.com/deepmind-media…
你可以在这里下载和使用Gemma:
kaggle.com/models/google/…
Image
Read 6 tweets
Feb 21
Open AI传奇研究员Andrej Karpathy的新课,教你理解和构建GPT Tokenizer。

他可以把相当复杂的LLM概念用非常好理解的方式讲出来。希望了解LLM的强烈建议听一下他的课,包括一些历史课程。

用GPT-4翻译了一下这节课,感兴趣可以听一下。字幕文件下载和历史课程会放在下面⬇️
补充一下视频介绍:

分词器是大语言模型(LLM)处理流程中一个独立且关键的环节。它们有专属的训练数据集、采用特定的训练算法——字节对编码(Byte Pair Encoding),训练完成后,分词器能够执行两个核心功能:encode() 函数将普通文本字符串转换为词元,而 decode() 函数则能将词元还原为原始文本字符串。在这场讲座中,我们将一步步揭开 OpenAI GPT 系列分词器的构建过程。

我们将发现,许多大语言模型(LLM)表现出的异常行为和问题,其实都源于标记化(tokenization)这一环节。我们会针对这些问题进行详细讨论,探究标记化为何成为问题的关键所在,以及为什么最理想的情况是有人能够找到办法,完全去除这一处理阶段。Image
两个月前他的另一节课《大语言模型简介》非常浅显易懂。

解释了大语言模型的训练过程以及什么是多模态,最后最重要的是LLM的发展方向以及发展路径。

如果你不是专业的机器学习出身又想了解LLM的话这节课是讲的最好的,希望看看。

我人工校对的视频也在后面网盘链接里。
Read 4 tweets
Dec 12, 2023
写个如何用 Ollama 在 Mac 本地跑 LLM,并且用在 Obsidian 上处理自己的笔记和内容的小教程。视频是具体的演示,我把等待时间剪掉了。
我们开始具体的教程🧵:
首先需要去Ollama的网站下载安装包, 下载完之后直接安装然后打开就行。 ollama.ai
Image
之后我们可以在他的 Github 上找到所有的命令,选择一个你需要的复制那个命令,找到你电脑里终端这个软件,然后粘贴刚才的命令,然后回车。比如:ollama run mistral
Github 地址: github.com/jmorganca/olla…
Image
Read 8 tweets
Sep 22, 2023
这个研究有点强的,我们可能获得了另外一种增强Stable Diffusion控制的方法,它允许你使用富文本书写提示词影响画面

比如指定某个提示词的颜色,例如提示词中有长发这个单词,然后你把长发的文字颜色改成了粉色,那么生成图像的头发颜色就会变成粉色

下面我们来看一下它支持的富文本格式和原理🧵
首先你可以通过字体颜色控制生成对象的颜色,比如下面这张图Hair头发的字体颜色被改成粉色的时候生成图像的头发颜色就会变为粉色 Image
然后你可以改变对应提示词单词的字体来赋予图像对应的风格,这个就有点意识流了,全看模型对这个字体的感知,比如下面这这张图的guitar吉他的字体如果是比较放松的就会生成彩色的吉他,如果是古朴的手写体吉他就比较有年代感。 Image
Read 6 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(