歸藏(guizang.ai) Profile picture
Apr 24, 2023 8 tweets 9 min read Read on X
AIGC Weekly #18更新了,本期主要介绍了Mini GPT-4等开源项目以及一些传统互联网公司的AI尝试动态和其他一堆非常值得阅读的内容。下面是上周一些行业动态和产品推荐,更多详细的内容可以去图里的竹白查看:
op7418.zhubai.love/posts/22622494…
#AI #GPT4 #AIGC Image
🥰本周精选(1):
上周值得关注的开源项目
RedPajama:一个计划创建一套领先开源模型的项目:together.xyz/blog/redpajama

Mini GPT-4:取巧的方式实现了多模态能力:huggingface.co/spaces/Vision-…

Stable Diffusion的开发商Stability AI发布了开源大语言模型Stable LM:stability.ai/blog/stability…twitter.com/i/web/status/1… Image
🥰本周精选(2):
一些传统互联网厂商的AI尝试
Raycast AI 逐步开放测试资格,这是功能介绍:raycastapp.notion.site/Raycast-AI-Bet…

谷歌计划构建新的搜索引擎:searchengineland.com/google-plannin…

Adobe Firefly 可以通过自然语言编辑视频了:

Webflow推出了自己的AI能力:webflow.com/blog/power-of-… Image
⚒️产品推荐(1):

AI 论文速递:快速阅读近期AI论文:briefgpt.xyz/chatgpt

Finchat:一个金融信息的ChatGPT:finchat.io

Vercel AI Playground:免费使用多个语言模型进行对比:play.vercel.ai/r/mWjP5Dt

Codeamigo:利用AI学习代码:codeamigo.devtwitter.com/i/web/status/1… Image
⚒️产品推荐(2):
Kickresume:AI优化简历:kickresume.com/en/

HyperDB:与 LLM 代理一起使用的本地矢量数据库:github.com/jdagdelen/hype…

HealthGPT:分析你的健康数据:

MULTI·ON Browser:ChatGPT控制你的浏览器:

Better Prompt:Stable… twitter.com/i/web/status/1… Image
🧑‍🎓学习资源:

如何在本地快速部署AutoGPT:

微软的机器学习工程师课程:udacity.com/course/ai-fund…

ChatGPT 课程——使用 OpenAI API 编写 5 个项目: Image
🔬精选文章(1):

Sam Altman:未来LLM的规模不会那么重要:techcrunch.com/2023/04/14/sam…

一种新的计算方法重新构想人工智能:quantamagazine.org/a-new-approach…

Multimodal C4:一个开放的、10亿规模的、与文本交错的图像语料库:arxiv.org/abs/2304.06939

Inpaint… twitter.com/i/web/status/1… Image
🔬精选文章(2):
经济学案例,为什么AI不能抢走你的工作:notboring.co/p/intelligence…

对齐你的潜变量:利用潜变量扩散模型的高分辨率视频合成:arxiv.org/abs/2304.08818

深度探讨大语言模型生态链:芯片,基建,工具,开源,应用:xiaoyuzhoufm.com/episode/644033…twitter.com/i/web/status/1… Image

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏(guizang.ai)

歸藏(guizang.ai) Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

Sep 29
Karpathy 说 NotebookLM 播客功能中可能蕴含着类似 ChatGPT 的机会,一个新的 AI 交互范式。

我一直关注和等待的东西,终于有行业核心人物注意到了,这个机会可能比 ChatGPT 还要大的多。

写了篇内容详细介绍了一下这个新的 AI 范式里面的逻辑。

将已有的庞大文本内容利用日渐成熟的其他模态 AI 模型转换为更多可被用户消费的内容形态,从而满足更多的用户消费场景。Image
Perplexity 的发现页面将全世界大量不同语言的新闻内容重新整合。

变为可以被不同语言消费的新闻信息流。

同时 TTS 的加入让用户的消费场景获得了极大的拓展,可以不用盯着屏幕了。
NotebookLM 将用户感兴趣的长篇文字内容拆解、总结、整合,让其更符合用户消费习惯。

播客的加入也让整理内容的消费场景获得了拓展,另外对谈的形式也避免了让用户提问题这个成本很高的动作。
Read 6 tweets
Mar 12
Cognition发布首位AI软件工程师Devin,这个演示相当惊艳。

Devin 是一个自主Agents,它通过使用自己的 shell、代码编辑器和网络浏览器来解决工程任务。

Devin成功通过了知名人工智能公司的实际工程面试,甚至还在 Upwork 上完成了实际工作。

Devin 在无辅助情况下正确解决了 13.86% 的问题,远远超过了之前最先进模型 1.96% 的无辅助和 4.80% 的辅助性能。

它可以学习如何使用不熟悉的技术,可以为成熟的生产资源库做出贡献,可以训练和微调自己的人工智能模型,甚至试着在 Upwork 上给 Devin 提供真实的工作,它也能完成。
这里有关于Devin的详细介绍:
cognition-labs.com/blog
Devin 通过自主学习对应文章生成图片的案例
Read 4 tweets
Feb 29
之前推荐过的国内☁️云服务平台揽睿星舟最近上线了 ComfyUI,他们是真想把这玩意的云服务做好,很适合入门学习。

把常用的 ComfyUI 插件和模型都上传上去了,我把我自己常用的一个相对复杂的 Animatediff 工作流拖进去发现所有的插件和模型都是 OK 的,一键运行。

👇下面也会有启动的教程和地址 Image
你可以在这里使用注册和使用揽睿星舟,通过这个链接会有优惠券,如果你只是想体验的话配合无门槛优惠券充值一块钱就可以用:

我们开始简单的使用教程lanrui-ai.com/register?invit…
登录之后可以点击左侧导航的工作空间,然后点击右侧创建工作空间。 Image
Read 9 tweets
Feb 21
见鬼了,谷歌居然开源LLM模型了,Meta要慌了。

Gemma 采用了和Gemini一样技术的开源LLM,同时质量也比同规模的模型要强。

下面是一些要点:

◈ 两种尺寸的模型权重:Gemma 2B和Gemma 7B。每种尺寸都有预训练和指导调整的变体。

◈ 一个生成式人工智能工具包,为使用Gemma创建更安全的人工智能应用提供指导和必要工具。

◈ 通过原生Keras 3.0为所有主要框架(JAX、PyTorch和TensorFlow)提供推理和监督微调(SFT)的工具链。

◈ 准备好的Colab和Kaggle笔记本,以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT等流行工具的集成,使得开始使用Gemma变得非常容易。

◈ 预先训练和经过调整的Gemma模型可以在您的笔记本电脑、工作站或Google Cloud上运行,并可以轻松部署到Vertex AI和Google Kubernetes Engine(GKE)。

◈ 跨多个人工智能硬件平台的优化确保了行业领先的性能,包括NVIDIA GPU和Google Cloud TPU。

◈ 允许所有组织进行负责任的商业使用和分发,无论规模大小。

◈未来还会发布Gemma更大模型变体。

了解更多:blog.google/technology/dev…Image
Gemma模型与Gemini共享技术和基础设施组件。

这使得Gemma 2B和7B能够在与其他开放模型相比实现最佳性能。

Gemma在关键基准测试中超越了明显更大的模型。

详细的技术报告在这里:storage.googleapis.com/deepmind-media…
你可以在这里下载和使用Gemma:
kaggle.com/models/google/…
Image
Read 6 tweets
Feb 21
Open AI传奇研究员Andrej Karpathy的新课,教你理解和构建GPT Tokenizer。

他可以把相当复杂的LLM概念用非常好理解的方式讲出来。希望了解LLM的强烈建议听一下他的课,包括一些历史课程。

用GPT-4翻译了一下这节课,感兴趣可以听一下。字幕文件下载和历史课程会放在下面⬇️
补充一下视频介绍:

分词器是大语言模型(LLM)处理流程中一个独立且关键的环节。它们有专属的训练数据集、采用特定的训练算法——字节对编码(Byte Pair Encoding),训练完成后,分词器能够执行两个核心功能:encode() 函数将普通文本字符串转换为词元,而 decode() 函数则能将词元还原为原始文本字符串。在这场讲座中,我们将一步步揭开 OpenAI GPT 系列分词器的构建过程。

我们将发现,许多大语言模型(LLM)表现出的异常行为和问题,其实都源于标记化(tokenization)这一环节。我们会针对这些问题进行详细讨论,探究标记化为何成为问题的关键所在,以及为什么最理想的情况是有人能够找到办法,完全去除这一处理阶段。Image
两个月前他的另一节课《大语言模型简介》非常浅显易懂。

解释了大语言模型的训练过程以及什么是多模态,最后最重要的是LLM的发展方向以及发展路径。

如果你不是专业的机器学习出身又想了解LLM的话这节课是讲的最好的,希望看看。

我人工校对的视频也在后面网盘链接里。
Read 4 tweets
Dec 12, 2023
写个如何用 Ollama 在 Mac 本地跑 LLM,并且用在 Obsidian 上处理自己的笔记和内容的小教程。视频是具体的演示,我把等待时间剪掉了。
我们开始具体的教程🧵:
首先需要去Ollama的网站下载安装包, 下载完之后直接安装然后打开就行。 ollama.ai
Image
之后我们可以在他的 Github 上找到所有的命令,选择一个你需要的复制那个命令,找到你电脑里终端这个软件,然后粘贴刚才的命令,然后回车。比如:ollama run mistral
Github 地址: github.com/jmorganca/olla…
Image
Read 8 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(