Post

More from @indigo11

indigo

@indigo11

Jul 15, 2024

上周 Bloomberg 透露了 OpenAI 内部会议上 AI 智能等级的最新定义，一共五个 Level，我们现在还处于 Level 1，但很快就能达到 Level 2。其实 Deepmind 在今年早些时候也发表一个 Levels of AGI 的分级，还有 Anthropic 去年九月的 ASL 也是一种基于安全等级的智能分级，我把这三家 AGI 公司的等级做了个横向对比表格✨

OpenAI 的分级更像系统功能的扩展，和他们的目标一致，AGI 解放生产力，不过玄学级别的 Level 2 推理要是实现了，后面那几个都是工程问题，所谓一生二，二生万物。。

Deepmind 则是完全对标人类的能力衡量 AI，硬核提升单体智能，直到超人出现；唯有 Anthropic 从人类安全视角来做分级，只有它们提到了 AI 的自主性和自我升级能力会带来的潜在威胁，他们的任务就是在 AI 出现自主意识之前将其识别并控制起来，果真全员 70% Doomer 的研究机构🤔

OpenAI 告诉员工他们已经接近 Level 2 了。。

Deepmind 在去年十一月发表过一篇论文《Levels of AGI》，他们给 AGI 的定义提出了六个原则，其中最重要的一点“关注能力，而非过程”，我们应该关注 AGI 能完成什么，而不是它如何完成任务。AGI 系统不需要像人类一样思考或理解，也不需要具备意识或感知能力 arxiv.org/abs/2311.02462

Read 4 tweets

indigo

@indigo11

Feb 15, 2024

欢迎来到东京🗼 这段效果炸裂的视频是 OpenAI 今天最新发布的 Text-to-Video 模型 Sora 生成！

Sora 可以创作长达 60 秒的视频，能实现详实的场景、复杂的运镜，以及表情生动的多角色。。手握最强 LLM 的 OpenAI 剑一出手就封喉🗡️ 无论你生成什么，先得有脑子有逻辑才是王道！

那些做视频生成的创业团队，必须得像 Midjourney 那样在效果和产品路线上专业化，才能有出路🤔

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually. the street is damp and reflective, creating a mirror effect of the colorful lights. many pedestrians walk about.”openai.com/sora

Prompt: Reflections in the window of a train traveling through the Tokyo suburbs.

Prompt: “Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”

Read 4 tweets

indigo

@indigo11

Nov 5, 2023

今天，对外公开了他们的首款产品 Grok，一个全新的大语言模型，它将具备：

- 25000 Tokens 的上下文窗口；
- 极快的响应速度，能实时获取 𝕏 的信息，对比其它模型这是一个巨大的优势；
- Grok 的知识库是基于886.03GB 的 The Pile （一个开源的语言数据库）和整个 𝕏 平台的 Exabytes 数据库微调而成；
- 计划提供 API，还有图像识别和音频识别；
- Grok 的一个版本将使用本地计算能力在 Tesla 中“本地”运行
- 测试版 𝕏 Premium+ 的订户才能使用。。

xAI 脚踏 𝕏 与 Tesla 两大平台的文本、图像还有现实世界的视频数据，这将是其它模型公司不具备的优势，它联通了数字和物理世界；同样未来 Grok 也会被用来增强 𝕏 还有 Tesla 的 FSD，弥补其缺失的语言模型智能。Grok 将是ChatGPT 的一个有力的竞争对手🤔

—

除了大家都在转发的几个重要特性之外，再给分享一些来自今年七月 Elon 在 X Space 讨论中透露的一些细节：

xAI 的目标是开发有益于人类的 AGI，专注理解宇宙。其方法是创造一个最大程度上充满好奇心、追求真理，并努力减少信念与现实之间误差的 AI。这旨在避免 AGI 按照固定或错误的道德观进行对齐可能带来的潜在危害。

关于架构与数学理解

xAI 期望揭示宇宙的基本真理并分享这些知识，重点是利用科学和工程技术来构建AI，进行快速迭代和简化解决方案，而不是依赖粗暴的计算力。

数学被视为严谨理解的框架，类似于工程学中的物理。概念模型和理解对于在先进的神经网络至关重要，科学家和数学家将会将会在 xAI 中与工程师并肩作战。

和现实世界的结合

Elon 看到 xAI与 Tesla 的现实世界 AI 合作带来的潜在好处，因为 Tesla 在部署用于自动驾驶的神经网络方面取得了重大突破，将两家公司的工程师汇集在一起可能会在捕获复杂的真实世界现象方面带来互助的改进。xAI 将开发关于概念性的3D世界的知识，而不仅仅是利用互联网的数据，现实世界的反馈将被大量采用。

关于 AI 的安全

为了安全，任何像 Optimus 这样的实体机器人都必须有硬编码的物理开关，以便在必要时强制关闭它们。无线远程访问可能会被黑客攻击，因此物理切断是必要的，尤其是对于那些可以随人走到任何地方的移动 AI。

合理的 AGI 规范可以接受，但是会严重阻碍进步的过度限制将会受到反对。为了安全而做出的一些延迟是值得，确保AGI 安全的途径是最大限度地提高透明度。Elon 表示如果需要揭露任何损害公众利益的不当政府要求，他愿意冒着坐牢的风险。如果政府机构试图秘密地以不符合公民利益的可疑动机影响技术，xAI 将坚决反对。

减少不平等和平权治理

xAI 团队表示，让每个人都能使用AI 的知识以帮助整个人类十分重要。广泛可靠的 AI 帮助可以大大减少机会的不平等。作为一家公司，xAI 向着真实性和赢得公众信任的目标努力，而不是优化利润或控制。

xAI 强调透明度和与学术界/研究人员的开放合作，它希望避免大型科技公司那样限制，将促进公众参与决策，任何人都可以对 xAI 的未来方向进行投票（但 Elon 今天特意发帖强调他旗下的任何公司都不会发币的。。）

—

总的来说，Elon 表示通过 AI 在数学和科学中做出基本的新发现和实现新的能力将是重要的里程碑。在多个学科中创造新知识的能力超过人类，这就意味着 AI 实现了真正的通用智能🤟x.AI

在这些基准测试中，Grok-1 展现出了强劲的性能，超过了其计算等级中的所有其他模型，包括 GPT-3.5 和 Inflection-1。性能仅次于那些使用了大量的训练数据和计算资源进行训练的模型，如 GPT-4。这展示了 xAI 在训练LLMs 上出色的效率🙌

关于今年七月在 X Space 上讨论 xAI 愿景的完整记录，可以看这篇 INSIGHTS INTO XAI, THE NEW COMPANY FROM ELON MUSK readmultiplex.com/2023/07/19/ins…

Read 4 tweets

indigo

@indigo11

Oct 3, 2023

在那篇《Sparks of AGI》的针对 GPT-4 的研究论文之后，微软又给出了一篇 166 页的针对 GPT-4V 潜能的超强研究报告《The Dawn of LMMs》- 大型多模态模型的黎明🌅 这篇报告将是 GPT-4V 高级用户的必读之作，强烈推荐阅读原文！论文地址：

研究者对广泛的领域和任务进行了采样测试，包括开放世界的视觉理解、视觉描述、多模态知识、认知常识、场景文本理解、文档推理、编码、时间推理、抽象推理以及情感理解等。GPT-4V 在许多实验领域都表现出了令人印象深刻的人类水平的能力🧵arxiv.org/abs/2309.17421

GPT-4V 在视觉理解、描述、常识、场景文本理解等领域展现出人类水平的能力👀

GPT-4V 能够很好地理解在像素空间上的编辑，例如在输入的图像上直接标记和做文本标识。受这种能力的启发，研究者提出了「视觉参考提示词 - Visual Referring Prompting」的概念，它可以与其他图像和文本提示无缝结合使用，为教学和示例演示提供了一个细致入微的全新界面✍️

Read 7 tweets

indigo

@indigo11

Jun 10, 2023

EO 的这段采访 Notion 的短片不错！Ivan 亲述了全员去京都开发 2.0 版的故事。Notion 的爆点就是从这一版开始的，提供简单的模版来帮你完成工作，用户并不想自己去构建什么，而是需要完成工作，这就是需求！作为一名从 2018 年就开用的老用户，分享下印象比较深的几个点🧵

Notion 最开始是要做一个让大家都可以自己做 software的东西，就是 drag and drop 做网站之类的软件，但是一直没抓住用户，然后 Ivan 和 Akshay 意识到 “intuitively, everyone wakes up not to build a software, they wake up to do their job”

Ivan 提到了很多次 “if you solve user's problem，they will love you”, 真实需求的重要性，他有一段时间陷入到了给自己 build a tool 的圈子里，然后发现效果不好，需要及时的 release 到市场上，拿到用户真实反馈，然后不断去 improve

Read 6 tweets

indigo

@indigo11

May 23, 2023

继 Google I/O 之后 Microsoft Build 也 All in AI！在今年二月 Bing 与 Edge 深度绑定 OpenAI 后，今天又宣布了：
- Window Copilot 在操作系统级别集成 AI
- 完整的 Copilot Stack 开发框架
- 以及 Azure AI Studio
macOS 你再不把 Siri 升个级
会拉低系统智商的。。😓

https://twitter.com/indigo11/status/1661135309982281728?s=20

Copilot & Plugins
这是微软为全新的 AI 驱动的软件提供的 Copilot Stack 框架，在这里你可以开发 ChatGPT & Bing Chat 插件，也可以为 Microsoft Copilots & Windows Copilots 开发插件，当然你也可以开发自己的 Colipots！详见