AYi Profile picture
AYi
大厂组织发展专家 × 心理学硕士 × AI 重度实践者 分享有用的 AI 实践,也分享工具之外的深度认知 AIGC | Prompt Engineering | 商业思维 丨职场丨认知心理学 🐈 喜欢健身,玩游戏,和 4 只猫一起生活和工作
May 9 4 tweets 1 min read
Damn,Redis创始人用一个C文件,干翻了大厂烧几十亿的GPU集群。

Antirez,那个写出Redis的传奇黑客,昨天开源了ds4。

一个专门为DeepSeek V4 Flash写的原生推理引擎,只有几千行C代码。

它做到了一件很多人都觉得不可能的事:
把拥有1M上下文窗口、能跑完整coding agent循环的准前沿模型,完整跑在一台普通的128GB MacBook Pro上。

YC CEO Garry Tan看完直接转发,只说了一句话:
“正在下载… 1M上下文+可用的coding agent能力,全在一台128GB MacBook上,这太疯狂了🤯”

这已经不是一个普通的量化项目那么简单了铁汁们,
属于顶级黑客用极致的系统工程,把闭源实验室烧几十亿才能玩的东西,压到了每个人的笔记本里。

他的三个黑客级操作,每一个都颠覆了行业常识:

1. 不对称2-bit量化:
只对MoE里占90%体积的专家部分做2-bit压缩,所有关键路径保持全精度。
质量损失极小,Antirez本人亲测“coding agent工作良好,能可靠调用工具”。

2. 把KV Cache扔到SSD:
很多人都觉得KV Cache必须放内存,1M上下文会直接炸掉128GB内存。
他直接把KV Cache搬到了苹果的高速SSD上,用磁盘当扩展内存,彻底突破了硬件天花板。

3. 纯Metal原生优化:
没有任何多余的封装,
没有通用框架的开销,
所有代码只为Apple Silicon写,
只为DeepSeek V4 Flash写。

实测性能:M3 Max 128GB上稳定27 tok/s。

不算快,但对本地跑agent循环来说,完全够用了。

你不用再给OpenAI付API费,不用再担心数据泄露,不用再忍受网络延迟。

所有的AI能力,完完全全在你自己的电脑里。

卧槽,这才是真正的革命,
过去AI的权力攥在少数几家大厂手里,他们有GPU集群,定价格,甚至说删就删。

现在,一个黑客用几千行C代码,就把这个权力还给了每一个开发者。

开源AI真的是不可阻挡的,
大厂烧几十亿训练出来的模型,只要权重一开源,

全世界的黑客就会用你想象不到的方式,把它优化到每一个能跑的设备上。

今天是MacBook,明天是手机,后天是手表,太让人兴奋了!

2026年5月9日,AI终于从云端的神坛,落到了每个人的笔记本里。

或许这一天,会被写进历史! 实测已经跑通了,128GB M3 Max下载q2版本就能直接跑。OpenAI兼容的服务器一键启动,直接对接OpenClaw、Claude Code这些agent工具,体验和云端几乎没差
Mar 28 7 tweets 1 min read
你越急着堆复杂的多Agent框架,
越做不出真正能用的AI Agent。

这篇221万浏览1.8万收藏的完整教程,
把从零造AI Agent的每一步都拆透了。

没有空泛的概念,没有复杂的开发要求,是普通人今天就能落地的完整路径。

主要内容拆解在评论区,一起学习👇 Image 大多数人做Agent,从一开始就搞反了顺序。
为了Agent而Agent,先去卷各种花里胡哨的框架,却从来没先想清楚,自己到底为什么需要一个Agent。
所有复杂的Agent系统,拆到最后,都是一个最基础的核心循环。
用户输入,大模型思考,决定调用工具还是直接回复,再回到循环的起点。
工具是Agent的手,记忆是Agent的记事本,检索是Agent的外部知识库。
所有复杂的设计,都是这个核心循环的延伸。
Mar 28 6 tweets 1 min read
学英语必读的一篇好文,
各位宝子别再每天
刷十几分钟单词APP硬背了,

老哥这篇文章讲透了语言学习的本质:脱离语境的孤立单词,转头就忘根本就是常态。

90%的人学语言背单词的顺序从一开始就错了,先过闪卡再看剧,才是符合大脑记忆逻辑的正确路径。

我折腾完这套AI语言学习系统才发现,原来大脑记不住单词,
核心原因是你给的信息没有场景和情绪锚点。

全文核心方法论和底层逻辑翻译+拆解见评论区👇Image 很多人学语言,总在重复一件事,每天雷打不动刷十几分钟单词APP,对着孤立的单词反复背诵,转头就忘得一干二净。
Mar 22 4 tweets 2 min read
大家还记得半个月前刷屏整个AI圈的传奇故事吗?
二十岁北邮大四学生郭航江,仅凭十天的Vibe Coding,
手搓出了能预演未来的群体智能引擎MiroFish。

上线即登顶GitHub全球趋势榜,狂揽2W+Star,
无数人用它推演红楼梦失传结局,预判舆情发酵路径,
模拟金融市场波动,盛大创始人陈天桥更是在看完Demo的二十四小时内,当场拍板三千万注资。

如果说MiroFish是让AI拥有了精准预判未来的能力,
那这次同一个团队带来的全新技术MSA,就是给AI装上了真正的海马体,彻底终结了困扰行业许久的电子失忆症。

一亿token的上下文窗口,全程性能下降不到百分之九,
这个数字放在整个AI行业里,都是足够炸裂的存在。

目前主流大模型的有效上下文,还卡在十二点八万到一百万的区间,它用端到端的MSA架构,彻底抛弃了传统的RAG外挂,把记忆直接长进了注意力机制里,直接把行业天花板捅到了一亿。

从一万六千到一亿,跨了近四个数量级,已经不是常规的渐进式改良了,等于是换了一套全新的思路,重构了AI的长期记忆能力。Image
Image
Image
Image
说实话,同为 4B 参数的两条线让我看了两遍:
Qwen3-4B 在 1M token 崩到谷底,
MSA-4B 在 1 亿 token 还稳在顶部,
上下文差 100 倍,一个塌方,一个几乎没掉。
我整理了张架构图,核心就一句话:
不压缩、不外挂,让记忆直接长进注意力机制里,
以前的「长上下文」,可能从来不是在记住,就是在硬撑🤣Image
Mar 14 4 tweets 1 min read
软件设计的底层逻辑要变天了,
之前我们做产品天天研究用户体验,想的是怎么让人类用得舒服,现在反过来了,你得先想怎么让 AI 智能体用得舒服😁

@levie 发的这篇《Building for trillions of agents》点透了一个趋势:未来10年,软件的主要用户不会是人,会是跑在服务器上的智能体。

我之前做AI工具踩过这个坑:功能UI做得再好看,没有完整的API,智能体根本调不动,等于白做。

什么叫做智能体想要的东西?三个核心标准:

#AI #产品设计 #SaaS创业 ① 所有核心功能100%可通过API访问,少一个都不行
② API设计优先给机器用:无歧义、结构化输出、高容错,不用考虑人类阅读体验
③ 定价支持按用量弹性计费,而不是按人头卖License
Mar 11 10 tweets 1 min read
Claude现在搞研究堪比斯坦福博士生了,熬一周读不完的30篇论文,
Claude30分钟给你理得明明白白,

这9个Claude 神级提示词,直接把学术研究的门槛砍到了底,30分钟理清50+篇论文,挖出你读10小时都找不出的矛盾点,揪出值得发论文的研究空白,搭出真正记得住的知识框架,收藏这条推文,下次写论文直接翻出来用。

连能发SCI的研究空白都给你挖出来,直接把Claude变成你的专属斯坦福级研究副驾,

全流程搞定文献到综述,赶紧收藏,写论文做课题直接抄。

9 个 Claude 提示词宝子们评论区自取👇Image 1️⃣ 我这里有[X]篇关于[主题]的论文,在我提问前,请先做三件事,
1. 列出所有论文:作者 + 年份 + 一句话核心观点,
2. 按共同假设分组归类,
3. 标注出观点互相矛盾的论文,别总结,给我画个「学术地图」。
Feb 28 6 tweets 1 min read
兄弟们,翻墙出来一定要对看优质的信息源,不要只是出来看片!多逛英推区,简直是一个宝藏!(◍╹x╹◍)

分享个大神的视频,思路和方法论特别顶,

7分13秒实战视频,直接把AI的信息上限彻底炸穿了,

如何让你的AI效用提升10倍:
赋予你的代理(使用 Claude Code)解析整个互联网并回答来自世界任何网站的问题的能力。
一旦拥有了这一点,你获取和处理信息的能力将变得无限。

@svpino 大神的这 7 分多视频精华我帮大家提炼总结在评论区了👇 1️⃣
给Claude Code这类AI代理装上Apify agent-skills,用确定性网页抓取+LLM智能分析的混合架构,让AI告别幻觉、告别弱搜索,直接升级成你个人的实时、无死角、全结构化情报引擎。