Oasis Feng Profile picture
Feb 16, 2023 17 tweets 3 min read Read on X
《财富》杂志披露的 OpenAI 股权设计引起了我强烈的好奇心,正巧眼下有一个投资 OpenAI 股权的机会,打算拿真金白银来换取一个可以近距离持续关注和了解 OpenAI 后续发展进程的机会。

也顺便借尽调的机会进一步窥探一下 OpenAI 这个股权设计的更多细节。
昨天给项目方作的一个评估,分享部分摘录。

OpenAI 和 DeepMind 作为全球 AI 顶流,分别下注了两个通向 AGI(通用人工智能)截然不同的道路。

DeepMind 认为大量不同领域的"模式学习"是人类进化出智慧的必经道路。所以它们不断在各个领域尝试以机器学习及强化学习掌握范式,希望从中沉淀出泛智能。\
OpenAI 认为语言是智慧的基石。人类究竟是先拥有想象力才发展出语言来表述所想,还是随着语言对抽象表达的助推才促进了人类想象力的发展,尚存争议。

OpenAI 押注了后一个观点,试图通过构建大模型对海量人类语言表述进行解构,在短时间内模仿人类智慧的漫长进化历程,形成一个泛智能的预训练模型。\
学界也有一些支撑 OpenAI 观点的过往研究,比如 《The Origin of Concepts》(Susan Carey)、《How Language Shapes Thought》(Lera Boroditsky)。

如果这个观点最终被 OpenAI 用 GPT 证明,那么将不仅是 AI 领域的巨大突破,更有可能颠覆人类在 认知心理学、脑科学,甚至 哲学 方面的诸多研究。\
但现阶段由 ChatGPT 所暴露出现的一些短板,似乎也预示了这条道路上的一些巨大障碍。

比如,如果语言本身就能发展出抽象思维能力,那么为什么 ChatGPT 尚无法理解一些简单逻辑表述背后的实际含义?

人类在数万年探索真理的道路上,语言所起到的,到底是辅助,还是基石角色?\
在项目方最关注的短期商业落地问题上,我认为 GPT 面临着一个较大的两难困境。

一方面是 to B 领域商业客户对信息质量及响应一致性的容忍度,OpenAI 能否在短期内取得可观的改善?另一方面是 to C 领域实际所发挥的价值因场景不同而悬殊巨大,OpenAI 可能很难设计出一个能最大化自身收益的定价机制。\
反而是在某些 B & C 领域的交叉地带,或者一些表面 to B,实则 to C 的通道型场景中,ChatGPT 或许有机会在短期内取得一个较好的平衡,实现成功的规模化商业落地。

比如在线游戏中的 NPC 交互,对内容质量的要求就远没有传统商业场景那么苛刻,却又能带来崭新的颠覆性体验。\
从中长期来看,OpenAI 和 DeepMind 道路选择的差异也会直接体现在商业落地上。

OpenAI 相信通用大模型的力量,认为场景化落地只需补充相关的上下文输入(类似现阶段提示词的延伸)。如果未来被验证可行的话,那么商业化就可能会爆发性的指数增长。但从当前 ChatGPT 的表现来看,这还是一个大大问号。\
DeepMind 一直在各个细分领域深耕模型的定制化,并不断作出各种创新,所到之处都掀起了不小的波澜。这就类似于一个人选择在少数领域深入探索,成为了多个领域的专家,从而产生出触类旁通的思维厚度。

这样的商业化,在范式匹配的领域中很可能是降维打击级别的力量,但却未必会像 GPT 那样遍地开花。\
最后,我给项目尽调团队提出了一些建议:

1. 关注 Andrej Karpathy 加入 OpenAI 后的角色。其研究方向很可能是「视觉识别」,有望让 GPT 具备训练并理解视频输入的能力,想象空间很大。

2. 关注 OpenAI 与 Wolfram 潜在的合作可能。后者声称它或能填补 ChatGPT 的最大短板。writings.stephenwolfram.com/2023/01/wolfra…\
说几个大家可能没有意识到,即将被大语言模型 AI 颠覆的行业。

首先是网购。「AI 导购」将会彻底取代今天的商品搜索,它将像线下商场店员那样与你进行会话式的互动,询问你的需求,作出初始推荐,再根据你对推荐的嫌弃和补充的深化需求调整其推荐。

哪怕没有找到让你满意的商品,也会默默为你种草。\ Image
锁定候选商品后,也不再需要花大量时间去翻看商品评价,「AI 导购」会整合 商家介绍、购买者评价、网上的评测 等各种来源的信息,回答任何你想知道的关于这件商品的疑问,还能事先过滤掉那些卖家刷出来的评价 和 网上的软文。

对 AI 导购的信任(训练)深受数据质量影响,这会倒逼平台提升评价质量。\ Image
对话式 AI 不仅让电商基础体验重回最自然的交互形态,还将重构核心流量路径,融合原本泾渭分明的「搜索」与「推送」,并大幅提升流量转化率。这在流量金贵的今天将是碾压式的优势。

大语言模型的研发和训练成本,将会给电商行业筑起非常高的准入壁垒,那个靠低价补贴就能杀入电商的时代将一去不返。\
另一个将被大语言模型 AI 颠覆的行业是「基础教育」。

这个从 18 世纪的普鲁士兴起,一直延续至今被全球多数国家所采用的节奏划一「工厂式教育」,即将被完全个性化的「太子式教育」取代,让每个孩子都得到针对其特质定制的教学节奏和一对一辅导。这在 AI 成为老师前,即便发达国家也难以负担得起。\ Image
OpenAI 与「可汗学院」合作将 GPT-4 运用到线上教学中,打造了名为 Khanmigo 的 AI 助手,在课堂上充当助教,在课堂下作为导师。
openai.com/customer-stori…

学生可以像和人类老师进行线上互动那样与 Khanmigo 对话,获得解答和帮助,甚至是心理上的辅导和支持。

感兴趣的话可加入试点计划 waitlist。\
大语言模型还会严重冲击互联网的内容生态,尤其是公有知识域,深刻重构未来互联网的数字内容格局。

一开始会出现「仅限人类自由访问」的内容许可协议,昙花一现后,互联网内容的价值标准会彻底沦陷,大量的内容将不再对人类有吸引力,只能被动沦为 AI 的训练素材。人类会习惯直接问 AI,而不是浏览。\
接着 AI 的训练内容输入将出现高度分化,进而产生不同阶层特点的 AI。

精英阶层用财富和权力换取包含藩篱内容和隐秘知识的精英 AI 为己所用;普通知识阶层会尝试获取那些游离在训练素材灰色地带的 AI;而底层民众可以免费得到训练素材经过精心罗织的「普世 AI」,看似无所不能,其实世界观已被锁死。\

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Oasis Feng

Oasis Feng Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @oasisfeng

Jul 12, 2025
最近切切实实体会到,AI 诊疗比人强的地方,并不在专业度,而是对大量数据大海捞针的分析能力。

今年确诊了「动脉粥样硬化」,但无论是医生还是我自己,都一直未能找到具体成因,因为近年的体检指标中「四高」相关指标全都在参考范围内,自认为饮食也一直低糖低钠低脂,最后只能笼统归结为遗传因素。\ Image
但是如果找不到真正的成因,就很难谈得上对症治疗,所以医生也更多是遵循常规经验,试着先开了「瑞舒伐他汀」去控制 LDL-C。

今天试着把过去 12 年的体检报告全部喂给 Gemini 2.5 Pro 作 Deep Research。它居然从 2017 年那份体检报告中找到了一项其它年份体检都未涉及的真正元凶 ——「脂蛋白(a)」。\ Image
「脂蛋白 (a)」,简称 Lp(a),可能是绝大部分体检套餐都没有包含的检测项(包括当年在阿里就职时公司给高管提供的 VIP 体检套餐)。幸亏 2017 年老婆给我买了一档高端体检套餐,才记录下了这个今天被 Gemini 捞出的宝贵线索。

它几乎完全由遗传决定,不受饮食、运动甚至他汀等常规降脂药的显著影响。\ Image
Read 10 tweets
Jul 3, 2025
最近不少对 Gemini Cli 的讨论感觉大多不得要领。其实从 function call 到 MCP,再到 CLI,背后都遵循着一条主线 —— 为 agent 不断优化多工具调用。

OpenAI 对 o3 的训练,有个关键能力是单次推理中多次调用工具。这些先后进行的工具调用之间可以存在因果依赖(根据前一个输出决定后续调用的工具)。\
然而此前大部分 LLM 调用的工具都是由调用方定义和执行的,具有因果依赖的多次工具调用,只能分多次 LLM 调用实现。这种本地工具,由于环境和通信的原因,很难优雅地纳入 LLM 单次推理的多次工具调用中。

为了解决这个问题,Anthropic 推出了 MCP 协议,将工具从本地环境纳入相对可控的协调环境中。\
MCP 虽然相对可控,但通信和调用成本不算低,也不利于会话上下文传递。实践中很多高频用到的工具(比如文件操作、环境配置),其实都能快速本地执行。

所以今年各大 AI 头部公司不约而同发力 CLI,因为「命令行」恰恰是一个有着面向程序 I/O 悠久传统的成熟生态,Agent 可以快速接入海量的本地工具。\
Read 4 tweets
Jul 25, 2024
家里的 平板设备,简直就是与娃进行「社会工程学」攻防战的修罗场。

首先是防不胜防的「密码窥探」攻防升级螺旋。从一开始简单偷看屏幕点击被物理阻挡;发展到佯装经过身旁,分多次先后窥探密码的各位数字,再尝试拼凑还原;最近已经进化到根据手指移动的方位来推测数字,逼得我不得不加入手指伪动…\
其次是对设备解锁安全机制的降级攻击。

我之前还纳闷,iPad 的指纹解锁怎么频繁的不工作,非得让我输入密码。直到有一次无意中发现娃在把 iPad 交给老婆解锁前,竟然用 DoS 攻击强制让指纹解锁临时失效,诱导她输入密码,从而为密码窥探创造条件。

包括我自己很长时间都未能察觉这降级攻击的发生。\
再者,针对老年人的社会工程学攻击,那也是防不胜防。

有一次因为我和老婆都要外出,娃主动提出去外婆家做作业。老婆一开始还盛赞娃的体贴,没想到却中了她精心谋划的圈套。

中途外婆打电话来问 iPad 的解锁密码,说娃要在 iPad 上完成 IXL。老婆特意叮嘱不能让娃看到密码,没想到最后还是中招了…\
Read 6 tweets
Feb 18, 2024
将信息「视为人」也许过于抽象,不妨换到人类的视角,运用第一性原理来论证一下,为什么必须摒弃将信息拿来「交易」的思维。

实体物品 可被交易,因为在交易过程中,这件物品完成了「易手」,从而产生了清晰的产权更替。

现在请仔细想想,信息能易手吗?也能,但前提是我们发明出针对性记忆消除术。\
既然人类还尚未发明出记忆消除术,那么信息就实难完成传统意义上的「易手」,产权的更替也就缺乏实践基础。

通过引入「知识产权」的抽象概念,虽可在法律框架下借一系列人为定义的规则界定和约束信息的产权,但由于获得信息的收益相较于限制传播的成本具有压倒性优势,知识产权就势必执法成本高企。\
即便是按照人为设计的「知识产权」法条,确权其实也困难重重。

首当其冲的是「所有权」。随着现代社会知识变得愈发复杂,大量新知都是基于现有知识的衍生和发展。且不说「原创性」核查的技术难度和主观判断,生硬地切断知识的内在联系,授予不同的产权主体,在专利权的实践中已经造成了大量的问题。\
Read 9 tweets
Dec 6, 2023
最近开始尝试用 GPT 辅助写书。然后意识到,这个工具若要发挥出真正威力,整个写作习惯都需要进行范式迁移。

过去写书是先立个提纲,然后逐章逐节码字,写完之后再反复推敲调整。所以第一遍的成文基本决定了整个章节 80% 的行文基调。

用 ChatGPT 虽然也能勉强这样玩,但现在你有了另一个高级玩法。\ Image
虽然 GPT 码字的过程和我们的习惯一样,也是从前往后逐字推进。但效率上的差异,决定了它可以运用一种人类难以企及的范式。

文字生成的不确定性,既是 GPT 无法避免的短板,也是它最大的优势。第一遍成文,顶多只能达到 20% 的预期,还远达不到可以开始推敲调整的程度。接下来首先要做的是反复对焦。\
与 GPT 进行行文对焦,是一个相当反直觉的过程。倘若你尝试告诉它哪些语句写的不好要如何调整,结果往往是事与愿违,累得半死不说,整个段落会变得愈发拧巴。

因为 GPT 不是你自己,它只是你的助理。你真正需要做的是带上一付 OK 镜,跳出细节纵观全局,从思路上对它加以宏观引导,并让它多次成文。\
Read 7 tweets
Aug 8, 2023
最近看到 George Gilder 的新书 "Life After Capitalism:
The Meaning of Wealth, the Future of the Economy, and the Time Theory of Money"。

读完序言,就已经强烈感受到 Gilder 在书中表达的观点与我的研究思路惊人的一致,这给了我极大的鼓舞和敦促,我决定开始用文字写下我的研究并逐步发表。\ Image
书中表达了 Gilder 对构建「信息经济学」的几个基石性见解:

* 财富就是知识
* 增长就是学习
* 信息就是意外
* 金钱就是时间

你没有看错,他说的绝非「知识就是财富」,亦非「时间就是金钱」,而恰恰是相反的意思。

这两个看起来可能有些惊世骇俗的理论,正是十年前推动我「弃理从文」的坚定信念。\
全书主要阐释了这四个基石性见解,以及基于它们所构建的信息经济学的理论框架。

如果说 Gilder 的工作是为「信息经济学」这座大厦提供思想指引,我想我可以做的更进一步 —— 揭示出建造这一大厦所需要的「数学模型」。在 ChatGPT 协助下,我已经将研究推进到了模型仿真阶段。\
Read 5 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(