Latest Twitter Threads by @AYi_AInotes on Thread Reader App

May 9 • 4 tweets • 1 min read

Damn，Redis创始人用一个C文件，干翻了大厂烧几十亿的GPU集群。

Antirez，那个写出Redis的传奇黑客，昨天开源了ds4。

一个专门为DeepSeek V4 Flash写的原生推理引擎，只有几千行C代码。

它做到了一件很多人都觉得不可能的事：
把拥有1M上下文窗口、能跑完整coding agent循环的准前沿模型，完整跑在一台普通的128GB MacBook Pro上。

YC CEO Garry Tan看完直接转发，只说了一句话：
“正在下载… 1M上下文+可用的coding agent能力，全在一台128GB MacBook上，这太疯狂了🤯”

这已经不是一个普通的量化项目那么简单了铁汁们，
属于顶级黑客用极致的系统工程，把闭源实验室烧几十亿才能玩的东西，压到了每个人的笔记本里。

他的三个黑客级操作，每一个都颠覆了行业常识：

1. 不对称2-bit量化：
只对MoE里占90%体积的专家部分做2-bit压缩，所有关键路径保持全精度。
质量损失极小，Antirez本人亲测“coding agent工作良好，能可靠调用工具”。

2. 把KV Cache扔到SSD：
很多人都觉得KV Cache必须放内存，1M上下文会直接炸掉128GB内存。
他直接把KV Cache搬到了苹果的高速SSD上，用磁盘当扩展内存，彻底突破了硬件天花板。

3. 纯Metal原生优化：
没有任何多余的封装，
没有通用框架的开销，
所有代码只为Apple Silicon写，
只为DeepSeek V4 Flash写。

实测性能：M3 Max 128GB上稳定27 tok/s。

不算快，但对本地跑agent循环来说，完全够用了。

你不用再给OpenAI付API费，不用再担心数据泄露，不用再忍受网络延迟。

所有的AI能力，完完全全在你自己的电脑里。

卧槽，这才是真正的革命，
过去AI的权力攥在少数几家大厂手里，他们有GPU集群，定价格，甚至说删就删。

现在，一个黑客用几千行C代码，就把这个权力还给了每一个开发者。

开源AI真的是不可阻挡的，
大厂烧几十亿训练出来的模型，只要权重一开源，

全世界的黑客就会用你想象不到的方式，把它优化到每一个能跑的设备上。

今天是MacBook，明天是手机，后天是手表，太让人兴奋了！

2026年5月9日，AI终于从云端的神坛，落到了每个人的笔记本里。

或许这一天，会被写进历史！

https://x.com/AYi_AInotes/status/2052996691586932783

实测已经跑通了，128GB M3 Max下载q2版本就能直接跑。OpenAI兼容的服务器一键启动，直接对接OpenClaw、Claude Code这些agent工具，体验和云端几乎没差

Mar 28 • 7 tweets • 1 min read

你越急着堆复杂的多Agent框架，
越做不出真正能用的AI Agent。

这篇221万浏览1.8万收藏的完整教程，
把从零造AI Agent的每一步都拆透了。

没有空泛的概念，没有复杂的开发要求，是普通人今天就能落地的完整路径。

主要内容拆解在评论区，一起学习👇

https://twitter.com/hooeem/status/2037250422403113188

大多数人做Agent，从一开始就搞反了顺序。
为了Agent而Agent，先去卷各种花里胡哨的框架，却从来没先想清楚，自己到底为什么需要一个Agent。
所有复杂的Agent系统，拆到最后，都是一个最基础的核心循环。
用户输入，大模型思考，决定调用工具还是直接回复，再回到循环的起点。
工具是Agent的手，记忆是Agent的记事本，检索是Agent的外部知识库。
所有复杂的设计，都是这个核心循环的延伸。

Mar 28 • 6 tweets • 1 min read

学英语必读的一篇好文，
各位宝子别再每天
刷十几分钟单词APP硬背了，

老哥这篇文章讲透了语言学习的本质：脱离语境的孤立单词，转头就忘根本就是常态。

90%的人学语言背单词的顺序从一开始就错了，先过闪卡再看剧，才是符合大脑记忆逻辑的正确路径。

我折腾完这套AI语言学习系统才发现，原来大脑记不住单词，
核心原因是你给的信息没有场景和情绪锚点。

全文核心方法论和底层逻辑翻译+拆解见评论区👇

https://x.com/AYi_AInotes/status/2037225607180800036

很多人学语言，总在重复一件事，每天雷打不动刷十几分钟单词APP，对着孤立的单词反复背诵，转头就忘得一干二净。

Mar 22 • 4 tweets • 2 min read

大家还记得半个月前刷屏整个AI圈的传奇故事吗？
二十岁北邮大四学生郭航江，仅凭十天的Vibe Coding，
手搓出了能预演未来的群体智能引擎MiroFish。

上线即登顶GitHub全球趋势榜，狂揽2W+Star，
无数人用它推演红楼梦失传结局，预判舆情发酵路径，
模拟金融市场波动，盛大创始人陈天桥更是在看完Demo的二十四小时内，当场拍板三千万注资。

如果说MiroFish是让AI拥有了精准预判未来的能力，
那这次同一个团队带来的全新技术MSA，就是给AI装上了真正的海马体，彻底终结了困扰行业许久的电子失忆症。

一亿token的上下文窗口，全程性能下降不到百分之九，
这个数字放在整个AI行业里，都是足够炸裂的存在。

目前主流大模型的有效上下文，还卡在十二点八万到一百万的区间，它用端到端的MSA架构，彻底抛弃了传统的RAG外挂，把记忆直接长进了注意力机制里，直接把行业天花板捅到了一亿。

从一万六千到一亿，跨了近四个数量级，已经不是常规的渐进式改良了，等于是换了一套全新的思路，重构了AI的长期记忆能力。

https://x.com/AYi_AInotes/status/2034479369855590660

说实话，同为 4B 参数的两条线让我看了两遍：
Qwen3-4B 在 1M token 崩到谷底，
MSA-4B 在 1 亿 token 还稳在顶部，
上下文差 100 倍，一个塌方，一个几乎没掉。
我整理了张架构图，核心就一句话：
不压缩、不外挂，让记忆直接长进注意力机制里，
以前的「长上下文」，可能从来不是在记住，就是在硬撑🤣

Mar 14 • 4 tweets • 1 min read

软件设计的底层逻辑要变天了，
之前我们做产品天天研究用户体验，想的是怎么让人类用得舒服，现在反过来了，你得先想怎么让 AI 智能体用得舒服😁

@levie 发的这篇《Building for trillions of agents》点透了一个趋势：未来10年，软件的主要用户不会是人，会是跑在服务器上的智能体。

我之前做AI工具踩过这个坑：功能UI做得再好看，没有完整的API，智能体根本调不动，等于白做。

什么叫做智能体想要的东西？三个核心标准：

#AI #产品设计 #SaaS创业 ① 所有核心功能100%可通过API访问，少一个都不行
② API设计优先给机器用：无歧义、结构化输出、高容错，不用考虑人类阅读体验
③ 定价支持按用量弹性计费，而不是按人头卖License

Mar 11 • 10 tweets • 1 min read

Claude现在搞研究堪比斯坦福博士生了，熬一周读不完的30篇论文，
Claude30分钟给你理得明明白白，

这9个Claude 神级提示词，直接把学术研究的门槛砍到了底，30分钟理清50+篇论文，挖出你读10小时都找不出的矛盾点，揪出值得发论文的研究空白，搭出真正记得住的知识框架，收藏这条推文，下次写论文直接翻出来用。

连能发SCI的研究空白都给你挖出来，直接把Claude变成你的专属斯坦福级研究副驾，

全流程搞定文献到综述，赶紧收藏，写论文做课题直接抄。

9 个 Claude 提示词宝子们评论区自取👇

1️⃣ 我这里有[X]篇关于[主题]的论文，在我提问前，请先做三件事，
1. 列出所有论文：作者 + 年份 + 一句话核心观点，
2. 按共同假设分组归类，
3. 标注出观点互相矛盾的论文，别总结，给我画个「学术地图」。

Feb 28 • 6 tweets • 1 min read

兄弟们，翻墙出来一定要对看优质的信息源，不要只是出来看片！多逛英推区，简直是一个宝藏！(◍╹ｘ╹◍)

分享个大神的视频，思路和方法论特别顶，

7分13秒实战视频，直接把AI的信息上限彻底炸穿了，

如何让你的AI效用提升10倍：
赋予你的代理(使用 Claude Code）解析整个互联网并回答来自世界任何网站的问题的能力。
一旦拥有了这一点，你获取和处理信息的能力将变得无限。

@svpino 大神的这 7 分多视频精华我帮大家提炼总结在评论区了👇 1️⃣
给Claude Code这类AI代理装上Apify agent-skills，用确定性网页抓取+LLM智能分析的混合架构，让AI告别幻觉、告别弱搜索，直接升级成你个人的实时、无死角、全结构化情报引擎。

Share this page!

Enter URL or ID to Unroll