Thread by @FinanceYF5 on Thread Reader App

AI创业大潮下，如何快速高效的使用LLM构建应用程序？

@a16z 在6月21日发布万字长文《对LLM应用程序堆栈的当前观点》，由其合伙人@BornsteinMatt和@rajko_rad写作。

里面理顺了4种不同场景下的，整体流程，提到了16类，64个提高开发者效率的工具，值得开发者阅读

Thread：

原文：
逐段GPT4 翻译：https://t.co/AN1IqjTdfka16z.com/2023/06/20/eme…
mp.weixin.qq.com/s/nIuw16xkC3Tj…

常用工具：
有很多不同的方式可以利用LLM进行构建，包括从头开始训练模型，微调开源模型，或使用托管的API。我们在这里展示的堆栈是基于情境学习，这是我们看到的大多数开发者开始使用的设计模式（只有在有基础模型的情况下才可能）。

LLM应用的上下文数据包括文本、PDF和结构化格式如CSV或SQL表。开发者对数据加载和转换解决方案的选择差异大，包括传统的ETL工具和编排框架。大多数开发者使用OpenAI API进行嵌入，但也有开发者探索Cohere或使用开源库如Hugging Face的Sentence Transformers。向量数据库在预处理管道中至关重要。

LLM的提示策略和上下文数据整合正变得复杂且重要。大多数开发者通过实验简单的提示开始新项目，但这并不足以满足生产部署的准确性要求。

更高级的提示策略涉及到让模型的响应基于某种真实源，提供模型未经过训练的外部上下文。此外，编排框架如LangChain和LlamaIndex提供了帮助。

OpenAI API是开发LLM应用的首选，但进入生产阶段时会有更多选项，包括切换到更经济的模型，尝试其他供应商的模型，或使用开源模型。
一些新的供应商开始研发替代基础模型，以期缩小开源模型与专有产品之间的性能差距。在运行LLM的工具方面，缓存、记录和跟踪工具已被广泛使用。

AI代理框架

是当前参考架构中重要的缺失部分，这种框架有潜力为AI应用赋予新的能力，如解决复杂问题、对外采取行动、及从经验中学习。

尽管现有的如LangChain这样的框架已经引入了一些代理概念，但目前大多数代理框架仍处于概念验证阶段，尚未实现可靠、可重复的任务执行。

预训练的AI模型改变了软件架构，使得开发者能快速构建高级AI应用。

我们列出的工具和模式只是使用LLM的起点，随着模型训练等新发展，我们会更新内容，并在合适时发布新的参考架构。欢迎提供反馈和建议。

希望这对你有所帮助！

如果你喜欢这个主题，那么请：

1.关注我（@Financeyf5）以获取更多内容。
2.喜欢并转发下面的第一条推文：

Share this Scrolly Tale with your friends.

A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.

Share this page!

Enter URL or ID to Unroll