歸藏(guizang.ai) Profile picture
May 8, 2023 15 tweets 10 min read Read on X
AIGC Weekly #20更新了,本期主要介绍了谷歌泄露的文件引发的讨论以及New Bing的一堆更新内容等和其他一堆非常值得阅读的内容。下面是上周一些行业动态和产品推荐,更多详细的内容可以去图里的竹白查看:op7418.zhubai.love/posts/22673345… Image
🥰本周精选(1):

谷歌泄露文档“我们没有护城河,OpenAI也没有”:semianalysis.com/p/google-we-ha…

Stability AI CEO Emad表示他同时文章中的大部分观点,但以创新为护城河很难建立企业:
Alex Dimakis也表示同意这些观点大学和开源社区应该组织更多的活动来管理数据集:

Andrej Karpathy表示预训练LLM基础模型仍然非常昂贵。由于最近的PEFT(参数高效训练)技术非常有效,因此微调LLM正在变得非常便宜且有效 Image
🥰本周精选(2):
New Bing发布了一大堆更新功能:theverge.com/2023/5/4/23710…

Midjourney上周动态合集

Midjourney正式更新了模型的5.1版本,我也对V5.1做了测试
相较于V5他现在有这些变化:更高的一致性、对文本提示更准确、更少的不需要的边框或文本痕迹、改善了清晰度
你还可以使用更精准的提示词描述,但是需要切换为Raw格式

这里还有Orcton针对V5.1做的水面反射做的测试:

Nick做的V4、V5、V5.1、V5.1 RAW四种模型同一段提示词的测试:

Niji开启了移动端APP测试:sizigi.notion.site/Niji-journey-m…
上周Midjoureny的国内版本开启了付费测试,付费会员可以解除测试期间每天的使用限制,同时还能使用小程序版本。

Stable Diffusion Web UI 1.1.1版本更新:github.com/AUTOMATIC1111/… Image
⚒️产品推荐(1):
Slack GPT:Slack内部的原生AI功能:slack.com/intl/en-in/blo…

Opus Clip:可将长视频重新用作短视频:opus.pro

生成式UI(动态UI)演示Demo:

Auto-GPT官方的在线网站版本即将推出:news.agpt.co
Dream:AI驱动的无代码构建器:usedream.app

LLM report:监控Open AI API每个Key的使用情况:llm.report

hey pi:注重体验的聊天机器人:heypi.com/talk

Cozy-Nest:Stable Diffusion Web UI的主题扩展:github.com/Nevysha/Cozy-N… Image
StarCoder:专门为辅助编程训练的15B语言模型:huggingface.co/bigcode/starco…

Twelve Labs:通过文字搜索视频内容:twelvelabs.io

Folk:轻量级、可定制和智能的 CRM:folk.app Image
🧑‍🎓学习资源:

GPT-4 - 它是如何工作的,我如何使用它构建应用程序?:

Mojo--人工智能开发者的新编程语言(初见): Image
🔬精选文章(1):

Sam Altman和Greg Brockman谈AI与未来:possible.fm/podcast/samand…

Airbnb CEO访谈:明年人工智能将如何从根本上改变其Airbnb服务:skift.com/2023/05/03/int…

OpenAI 为开发 ChatGPT 亏损翻倍至 5.4 亿美元:theinformation.com/articles/opena…
AK专门在huggingface上开了一个推荐论文的页面:huggingface.co/papers

我想谈谈WebGPU-WebGPU为什么这么重要:cohost.org/mcc/post/14061…

可汗学院创始人Sal Khan TED演讲:ted.com/talks/sal_khan… Image
🔬精选文章(2):
大语言模型综述(推荐):github.com/RUCAIBox/LLMSu…

AI / ML / LLM / Transformer Models Timeline and List:ai.v-gar.de/ml/transformer…

首个基于单细胞生物学进行预训练的大型语言模型:biorxiv.org/content/10.110…

大型语言模型的涌现能力是海市蜃楼吗?:
arxiv.org/abs/2304.15004

指令调优过程中的语言模型中毒:arxiv.org/abs/2305.00944

大型语言模型和RLHF的全貌:assemblyai.com/blog/the-full-… Image
感谢大家看到这里,在此我也想给大家介绍一下有趣的内容和信息,如果你也觉得有意思的话可以私信我或者给我发邮件投稿。
订阅周刊:op7418.zhubai.love/posts/22673345…

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 歸藏(guizang.ai)

歸藏(guizang.ai) Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @op7418

Mar 12
Cognition发布首位AI软件工程师Devin,这个演示相当惊艳。

Devin 是一个自主Agents,它通过使用自己的 shell、代码编辑器和网络浏览器来解决工程任务。

Devin成功通过了知名人工智能公司的实际工程面试,甚至还在 Upwork 上完成了实际工作。

Devin 在无辅助情况下正确解决了 13.86% 的问题,远远超过了之前最先进模型 1.96% 的无辅助和 4.80% 的辅助性能。

它可以学习如何使用不熟悉的技术,可以为成熟的生产资源库做出贡献,可以训练和微调自己的人工智能模型,甚至试着在 Upwork 上给 Devin 提供真实的工作,它也能完成。
这里有关于Devin的详细介绍:
cognition-labs.com/blog
Devin 通过自主学习对应文章生成图片的案例
Read 4 tweets
Feb 29
之前推荐过的国内☁️云服务平台揽睿星舟最近上线了 ComfyUI,他们是真想把这玩意的云服务做好,很适合入门学习。

把常用的 ComfyUI 插件和模型都上传上去了,我把我自己常用的一个相对复杂的 Animatediff 工作流拖进去发现所有的插件和模型都是 OK 的,一键运行。

👇下面也会有启动的教程和地址 Image
你可以在这里使用注册和使用揽睿星舟,通过这个链接会有优惠券,如果你只是想体验的话配合无门槛优惠券充值一块钱就可以用:

我们开始简单的使用教程lanrui-ai.com/register?invit…
登录之后可以点击左侧导航的工作空间,然后点击右侧创建工作空间。 Image
Read 9 tweets
Feb 21
见鬼了,谷歌居然开源LLM模型了,Meta要慌了。

Gemma 采用了和Gemini一样技术的开源LLM,同时质量也比同规模的模型要强。

下面是一些要点:

◈ 两种尺寸的模型权重:Gemma 2B和Gemma 7B。每种尺寸都有预训练和指导调整的变体。

◈ 一个生成式人工智能工具包,为使用Gemma创建更安全的人工智能应用提供指导和必要工具。

◈ 通过原生Keras 3.0为所有主要框架(JAX、PyTorch和TensorFlow)提供推理和监督微调(SFT)的工具链。

◈ 准备好的Colab和Kaggle笔记本,以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT等流行工具的集成,使得开始使用Gemma变得非常容易。

◈ 预先训练和经过调整的Gemma模型可以在您的笔记本电脑、工作站或Google Cloud上运行,并可以轻松部署到Vertex AI和Google Kubernetes Engine(GKE)。

◈ 跨多个人工智能硬件平台的优化确保了行业领先的性能,包括NVIDIA GPU和Google Cloud TPU。

◈ 允许所有组织进行负责任的商业使用和分发,无论规模大小。

◈未来还会发布Gemma更大模型变体。

了解更多:blog.google/technology/dev…Image
Gemma模型与Gemini共享技术和基础设施组件。

这使得Gemma 2B和7B能够在与其他开放模型相比实现最佳性能。

Gemma在关键基准测试中超越了明显更大的模型。

详细的技术报告在这里:storage.googleapis.com/deepmind-media…
你可以在这里下载和使用Gemma:
kaggle.com/models/google/…
Image
Read 6 tweets
Feb 21
Open AI传奇研究员Andrej Karpathy的新课,教你理解和构建GPT Tokenizer。

他可以把相当复杂的LLM概念用非常好理解的方式讲出来。希望了解LLM的强烈建议听一下他的课,包括一些历史课程。

用GPT-4翻译了一下这节课,感兴趣可以听一下。字幕文件下载和历史课程会放在下面⬇️
补充一下视频介绍:

分词器是大语言模型(LLM)处理流程中一个独立且关键的环节。它们有专属的训练数据集、采用特定的训练算法——字节对编码(Byte Pair Encoding),训练完成后,分词器能够执行两个核心功能:encode() 函数将普通文本字符串转换为词元,而 decode() 函数则能将词元还原为原始文本字符串。在这场讲座中,我们将一步步揭开 OpenAI GPT 系列分词器的构建过程。

我们将发现,许多大语言模型(LLM)表现出的异常行为和问题,其实都源于标记化(tokenization)这一环节。我们会针对这些问题进行详细讨论,探究标记化为何成为问题的关键所在,以及为什么最理想的情况是有人能够找到办法,完全去除这一处理阶段。Image
两个月前他的另一节课《大语言模型简介》非常浅显易懂。

解释了大语言模型的训练过程以及什么是多模态,最后最重要的是LLM的发展方向以及发展路径。

如果你不是专业的机器学习出身又想了解LLM的话这节课是讲的最好的,希望看看。

我人工校对的视频也在后面网盘链接里。
Read 4 tweets
Dec 12, 2023
写个如何用 Ollama 在 Mac 本地跑 LLM,并且用在 Obsidian 上处理自己的笔记和内容的小教程。视频是具体的演示,我把等待时间剪掉了。
我们开始具体的教程🧵:
首先需要去Ollama的网站下载安装包, 下载完之后直接安装然后打开就行。 ollama.ai
Image
之后我们可以在他的 Github 上找到所有的命令,选择一个你需要的复制那个命令,找到你电脑里终端这个软件,然后粘贴刚才的命令,然后回车。比如:ollama run mistral
Github 地址: github.com/jmorganca/olla…
Image
Read 8 tweets
Sep 22, 2023
这个研究有点强的,我们可能获得了另外一种增强Stable Diffusion控制的方法,它允许你使用富文本书写提示词影响画面

比如指定某个提示词的颜色,例如提示词中有长发这个单词,然后你把长发的文字颜色改成了粉色,那么生成图像的头发颜色就会变成粉色

下面我们来看一下它支持的富文本格式和原理🧵
首先你可以通过字体颜色控制生成对象的颜色,比如下面这张图Hair头发的字体颜色被改成粉色的时候生成图像的头发颜色就会变为粉色 Image
然后你可以改变对应提示词单词的字体来赋予图像对应的风格,这个就有点意识流了,全看模型对这个字体的感知,比如下面这这张图的guitar吉他的字体如果是比较放松的就会生成彩色的吉他,如果是古朴的手写体吉他就比较有年代感。 Image
Read 6 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(