GPTDAOCN-e/acc Profile picture
热衷于使用#GenAI释放人类潜力的倡导者。致力于推广#GPT技术的开放探索!
2 subscribers
Aug 28, 2023 4 tweets 1 min read
a16z 最新研究:AI 与区块链下的新商业模式(长文)

作者:Dan Boneh,Ali Yahya
 
史蒂芬金曾写过一本科幻小说叫《钻石时代》,其中有一种人工智能装置,在人们的一生中充当人他们的导师。当你出生时,你就会与一个人工智能配对,它非常了解你——了解你的喜好,跟随你一生,帮助你做出决定,引导你走向正确的方向。这听起来很不错,但你绝不希望这样的技术落到中间商巨头手中。因为这样会给这家公司带来很大的控制权,以及延伸出一系列隐私和主权问题。
我们希望这一技术能够真正为我所有,于是一种愿景应运而生,那就是你可以用区块链来实现这一点。你可以在智能合约中嵌入人工智能。借助零知识证明的力量,保持数据的私密性。在未来几十年的时间里,这一技术会越来越智能。你可以选择做任何你想做的事,或者以任何你希望的方式改变它。
那么区块链与人工智能的关系如何?人工智能将带领我们走向什么样的世界?人工智能目前的现状与挑战如何?区块链在此过程中又会扮演什么样的作用呢?

AI与区块链:相互抗衡
人工智能发展,包括《钻石年代》中描述的这种景象其实一直存在,只是最近又经历了飞跃性的发展。
首先,人工智能在很大程度上是一种自上而下、集中控制的技术。而加密技术则是一种自下而上、去中心化合作的技术。从很多方面来说,加密货币是一门研究如何构建去中心化的系统的学问,这种系统可以实现人类的大规模合作,而不存在真正意义上的中心控制人。从这方面看,这就是这两种技术可以合二为一的一种自然方式。
人工智能是一种可持续的创新,它能强化现有技术公司的商业模式,帮助它们做出自上而下的决策。这方面最好的例子就是谷歌,它能够决定在数十亿用户、数十亿页面浏览量中为用户呈现的内容。而加密货币则本质上是一种颠覆性创新,它的商业模式与大型科技公司的商业模式根本相悖。因此,这是一场由边缘叛逆者带头的运动,而非当权者带领的运动。
因此,人工智能可能会与隐私保护各方面息息相关,两者相互促进、相互作用。人工智能作为一种技术,已经建立了各种激励机制,导致用户所有的隐私越来越少,因为公司想要获取我们的所有数据。而根据越来越多数据训练出来的人工智能模型也将变得愈加有效。另一方面,人工智能并非完美,模型可能有偏差,偏差可能导致不公平的结果。因此现阶段也很多关于算法公平性的论文。

我认为,我们会通往一条人工智能的道路,在这条道路上,每个人的数据都会被汇总到这些庞大的模型训练中,以优化模型。而加密货币则朝着相反的方向发展,即增加个人隐私,赋权用户掌控数据主权。可以说,加密技术是与一种人工智能相抗衡的技术,因为它能帮助我们从丰富的内容中分辨出人类或人工智能创造的内容,在一个人工智能创造的内容泛滥的世界,加密技术将成为维护和保存人类内容的重要工具。
加密货币就是狂野西部,因为它完全没有权限,因为任何人都可以参与。你不得不假定,其中有些参与方是恶意的。因此现在更需要一些工具来帮助你从不诚实的参与者中筛选出诚实的参与者,而机器学习和人工智能作为一种智能工具,实际上在这方面大有裨益。

例如,就有项目利用机器学习来识别提交给钱包的可疑交易。这样用户的这些交易就会被标记,并被提交到区块链上。这可以很好地防止用户不小心把所有的资金都提交给攻击者,或者做了一些事后会后悔的事。机器学习也可以作为一种工具,帮助你提前判断同样哪些交易可能存在mev。
正如LLM 模型可以用来检测虚假数据或恶意活动一样,反过来,这些模型也可以用来生成虚假数据。最典型的例子就是深度伪造。你可以创建一段视频,让某人说一些他从未说过的话。但是区块链实际上可以帮助缓解这一问题。
比如,区块链上有时间戳,显示在这个日期你说了这样那样的话。如果有人伪造视频,那么你就可以利用时间戳进行否认。所有这些数据,真正真实的数据都记录在区块链上,可以用来证明这个深度伪造的视频真的是假的。所以我认为,区块链可能有助于打击伪造。

我们还可以依靠可信的硬件来实现这一点。摄像头和我们的手机等设备会对拍摄的图像和视频进行签名,以此作为标准。它被称为C2PA,规定了相机如何签署数据。事实上,现在索尼的一款相机就可以拍摄照片和视频,然后在视频上生成C2PA签名。这是一个很复杂的话题,在此我们不再赘述。
通常情况下,报纸在刊登图片时,不会原封不动地刊登相机拍摄的图片。他们会进行裁剪,对照片进行一些授权处理。一旦你开始编辑图片,就意味着收件人、最终读者、浏览器上的用户看到的不是原始图片,就无法进行C2PA签名验证。
问题是,如何让用户确认他们看到的图像确实是由 C2PA相机正确签名的?这正是ZK技术的用武之地,你可以证明编辑后的图像实际上是对正确签名的图像进行向下采样和灰度缩放的结果。这样,我们就可以用简单的 zk 证明来代替 C2PA签名,并与这些图像一一对应。现在,读者仍然可以确认他们看到的是真实的图像。因此,zk 技术可以用来对抗这些信息。 区块链如何破局?
人工智能本质来说是中心化的技术。它在很大程度上得益于规模效应,因为依靠单一数据中心运行会让事情变得更有效率。此外,数据、机器学习模型、机器学习人才等通常由少数科技公司控制,
那么该如何破局?加密货币可以通过使用 ZKML 等技术来帮助我们实现人工智能的去中心化,可以应用在数据中心、数据库、机器学习模型本身。比如,在计算方面,使用零知识证明,用户就可以证明实际进行推理或训练模型的过程是正确的。
这样,你就可以将这一过程外包给一个大型社区。这种分布式流程下,任何拥有 GPU 的人都可以为网络贡献算力,并以这种方式训练模型,而不必依赖一个集中所有 GPU 的大型数据中心。

从经济学角度看,这是否有意义并不确定。但至少通过正确的激励措施,可以实现长尾效应。你可以利用所有可能存在的GPU 能力。让所有这些人都为模型训练或推理运行贡献计算能力,这将可以代替控制一切的大型科技公司。要实现这一点,必须解决各种重要的技术问题。实际上,有一家公司叫英伟达正在建立一个去中心化的 GPU 计算市场,主要用于训练机器学习模型。在这个市场上,任何人都可以贡献自己的GPU计算能力。另一方面,任何人都可以利用网络中存在的任何计算来训练他们的大型机器学习模型。这将成为openai、谷歌、元数据等集中式大科技公司的替代选择。
可以设想这样一种情况:Alice 有一个想要保护的模型。她想把模型以加密的形式发送给Bob ,Bob现在收到加密模型,需要在这个加密模型上运行自己的数据。如何做到这一点呢?那就要利用所谓的全同态加密计算加密数据。如果用户拥有加密模型和明文数据,那么就可以在明文数据上运行加密模型,接收并获得加密结果。你将加密结果发回给Alice,她就能解密并看到明文结果。
这实际上是已经存在的技术。问题是,目前的技术对中型模型很有效,我们能否将其扩展到更大的模型?这是一个相当大的挑战,需要更多公司的努力。

现状、挑战与激励机制
我认为要实现计算方面的去中心化。第一个是验证问题,你可以使用 ZK 解决这个问题,但是目前这些技术只能处理较小的模型。我们面临的挑战是,这些加密原语的性能远远无法满足对超大型模型进行训练或推理的需要。因此有很多工作正在进行,以提高证明过程的性能,从而可以高效地证明越来越大的工作量。
与此同时,一些公司也在使用其他技术,这些技术不仅仅是加密技术。而是采用博弈论性质的技术,他们让更多相互独立的人进行工作。这是一种不依赖于密码学的博弈论式的乐观方法,但它仍然与去中心化人工智能或帮助创建人工智能生态系统这一更大的目标相一致。这是openai等公司提出的目标。
第二个大问题是分布式系统问题。比如,你该如何协调一个庞大的社区,让他们为一个网络贡献 gp,从而让人感觉它是一个集成的、统一的计算底层?这其中会有很多有挑战,比如如何以一种合理的方式分解机器学习的工作量,并将不同的工作量分配给网络的不同节点,以及如何高效地完成所有这些工作。

目前的技术基本上可以应用到中型模型 ,但是无法应用于gpt 3 或 gpt 4 那样大的模型。当然,我们还有其他方法。例如,我们可以让多人进行培训,然后比较结果,这样就有了博弈论上的激励机制。激励人们不要作弊。如果有人作弊,其他人可能会抱怨他们计算的训练结果不正确。这样一来,作弊的人就得不到报酬了。
我们也可以在社区中分散数据来源,以训练大型机器学习模型。同样,我们也可以收集所有数据,然后自己训练模型,而不是由一个中心化的机构负责。这可以通过创建一种市场来实现。这与我们刚才描述的计算市场类似。
我们也可以用激励的眼光来看待,鼓励人们向某个大数据集贡献新数据,然后用来训练模型。这其中的困难与验证挑战类似。你必须以某种方式验证人们贡献的数据确实是好数据。这些数据既不是重复数据,也不是随机生成的垃圾数据,更不是以某种方式生成的不真实数据。
此外,还要确保数据不会以某种方式颠覆模型,否则模型性能实际只会越来越差。也许我们必须依靠技术解决方案与社会解决方案的结合,在这种情况下,你还可以通过某种社区成员能够获得的站点指标来建立可信度,这样当他们贡献数据时,数据就会比原来更可信一些。

否则真正实现覆盖数据分布是需要非常久的时间的。机器学习的一大挑战就是模型实际上只能覆盖训练数据集所能达到的分布范围。如果有一些输入远远超出了训练数据的分布范围,那么你的模型实际上可能会表现得完全不可预测。为了让模型在边缘情况、黑天鹅数据点或现实世界中可能遇到的数据输入中表现出色,我们需要一个尽可能全面的数据集。
因此,如果你有这样一个开放的、去中心化的市场,为数据集提供数据,你就可以让世界上任何拥有独特数据的人向网络提供这些数据,这是一种更好的方式。因为如果你试图以一家中心公司的身份来做这件事,你根本无法知道谁拥有这些数据。因此,如果可以创造一种激励机制,让这些人主动站出来提供这些数据,实际上可以获得明显更好的长尾数据
Jun 3, 2023 5 tweets 1 min read
图文学习:神经网络看起来可能非常复杂。

但它们都是由简单的元素构成的。

下面解释一下神经网络的构建块。

🧵

1/6 Image 神经网络主要有两部分:

- 节点或神经元
- 节点之间的连接

下面是一个简单的例子。

神经网络通常按层组织。那些是什么呢?

2/6 Image
May 29, 2023 10 tweets 3 min read
以下是你最需要的ChatGPT的30 个最新插件: Image 1/ SEO助手:生成搜索引擎关键字信息

2/ Jiggy Base:JiggyBase文档收集,以帮助生成事实性的,最新的聊天回应。

3/ 卡路里聊天:让卡路里计算比以往任何时候都更简单

4/ 表情包创建器:使用表情包创建器按需创建表情包。 Image
May 27, 2023 6 tweets 2 min read
现在每个人甚至他们的狗都在买GPU!

别说训练了,你甚至无法在本地硬件上微调LLM!

以下是一些可以免费获取高端GPU的好地方!🚀🧵👇 Image 1️⃣ AbacusAI 免费试用

@abacusai 现在提供免费试用,使用免费的GPU计算构建和训练AI模型。

额外福利!🔥
免费获取以下特性:
- ChatLLM:为自定义数据定制的ChatGPT
- AI Agents:构建你自己的AutoGPT
May 22, 2023 5 tweets 3 min read
📣OpenAI今天刚刚发布了最新另外38个ChatGPT插件‼️
这些插件包括用于营销、播客、金融、SEO、新闻等等……@OpenAI @sama @chatgpttrader @ChatGPTNFTs
以下是最新插件大全: Image 1. SEO: 搜索引擎优化,使用AI分析和改善你的网站SEO。
2.CORE AI: 核心AI,提供最新的AI新闻。
3.News: 新闻,将最新新闻发送至你的Podcastindex。
4.MixerBox: 混音器,从股票值中探索播客。
5.Search: 搜索,简便的全球股票分析方式。
6.Podcast:… twitter.com/i/web/status/1…
May 19, 2023 10 tweets 3 min read
如何创建你的个人聊天机器人🤖️,很简单,跟着步骤来 Image 参加搞要图 Image
May 19, 2023 11 tweets 3 min read
Orb是一个由Worldcoin项目开发的定制生物识别成像设备。Worldcoin是一个全球项目,其目标是为每个人提供访问数字资产的机会。他们的方法是通过分发一种新的数字货币,名为Worldcoin。… twitter.com/i/web/status/1… Image 2/ Orb是由@tfh_technology为Worldcoin项目开发的定制生物识别成像设备。它使用虹膜生物识别技术来验证一个人的人类属性和独特性,这种方式既安全又能保护隐私。 Image
May 18, 2023 5 tweets 1 min read
ChatGPT的官方应用程序来啦🚨🔔

这是产品向前迈出的又一大步,它带来了大量的新功能。让我们深入了解一下🧵 apps.apple.com/us/app/openai-… 首先,看看这个漂亮的新用户界面🤩: Image
May 16, 2023 7 tweets 2 min read
ChatGPT插件现已对所有人开放。
以下是所有45个插件以及它们如何使用指南: Image 1/ Slack:查询Slack信息
2/ Zapier:与5000+应用,如Google Sheets和Docs进行交互。
3/ Expedia:在一个地方激活你的旅行计划
4/ Klarna购物:在成千上万的在线商店中搜索并比较价格。
5/ 时尚杂志:搜索时尚杂志的文章
6/ 待办事项插件:在ChatGPT中管理待办事项列表
7/… twitter.com/i/web/status/1…
May 15, 2023 6 tweets 4 min read
🍀其实根本不需要1000个AI工具🫵🏻你真正需要的是那些实际上能够工作的工具✍️
下面是我们推荐的前20个工具以及我们推荐它们的原因 Image 聊天机器人方面,这里没有什么意外:
1、ChatGPT
2、Anthropic Claude和Bard
3、Bing Chat
我们会再仔细研究Bard,并看看它在哪些方面表现突出。

生成文字内容的工具:
4、Jasper @heyjasperai
• 工作流/模板对于初次尝试提示的人常常很有帮助
•… twitter.com/i/web/status/1…
May 14, 2023 4 tweets 1 min read
🤔即使ChatGPT最近发布了插件,是否正在失去优势?
请记住,Google的Bard目前运行在PaLM 2的Bison上。他们最大的模型Unicorn还没有发布。当看到Unicorn与ChatGPT的比较将会更令人兴奋
以下是Bard表现优秀的5个领域! Image 1、Bard获取最新信息更快
Bard内置了互联网搜索功能,无需任何插件。它可以快速获取最新的信息,而ChatGPT在浏览速度和响应时间上稍显落后。
2、生成符合当前趋势的创意… twitter.com/i/web/status/1…
May 14, 2023 4 tweets 1 min read
AI是未来的工作趋势。
但现在99%的人仍然处于入门阶段。
以下是3个ChatGPT提示,可以在2023年的工作中让你大步向前 1、有说服力的内容写作
提示:
我需要一篇[博客文章类型],能够清楚地讲解[产品/服务]的特性和优势,面向我们的[理想客户],并且能以强烈的行动号召说服他们购买。
May 14, 2023 6 tweets 1 min read
这周,AI成为了世界的焦点...
以下是这周发生的14件大事概述 Image 1/ OpenAI的新文本到3D模型
OpenAI发布了一种新的模型,可以将文本信息转化为3D模型。
2/ 沃伦·巴菲特对AI的担忧和惊奇
投资大师沃伦·巴菲特对人工智能的发展表示了既担忧又惊奇的态度。
3/ 微软和AMD联手
微软和AMD宣布联手,可能是为了在AI领域开展某些合作。
May 12, 2023 7 tweets 2 min read
谷歌刚刚发布的26个最新插件的列表(全部新的)🧵" Image 1/ Spotify
使用场景:利用你的播放列表的数据来寻找新的歌曲。
或者简单地通过Bard播放你最喜欢的歌曲。
2/ Data Commons
使用场景:在你的研究/提示中分析和使用来自人口统计、经济、排放和气候的数据集。
3/ Indeed
使用场景:找不到合适的工作?
将你的简历上传到Bard,找到最适合你的工作。
Apr 21, 2023 4 tweets 2 min read
⚡️WebGPT来了⚡️又一个开源新品!
Chrome本月发布了WebGPU,让网页上的GPU速度接近原生!
开发者推出了WebGPT:一个让GPT模型完全在浏览器上运行的工具包。
为什么这个项目很重要?看这里:twitter.com/i/web/status/1 WebGPT只用四个JavaScript文件就实现了功能。不需要安装,只有约1000行代码!
这意味着很快,每个设备都可以轻松运行模型,只需点击一个链接。无缝操作,高度互通。
Apr 21, 2023 5 tweets 3 min read
想免费使用GPT-4?这里有7种方法让您免费体验:
1、Bing聊天:访问 bing.com/new,然后点击左上角的“Chat”按钮。您将能够免费使用GPT-4。对于非Edge浏览器用户,请安装Bing Chat扩展,以充分利用此功能。 2、HuggingFace:这个平台提供了各种语言模型,包括ChatGPT-4。访问 huggingface.co,然后点击顶部菜单栏的“Models”选项卡。选择 GPT-4 并开始体验:huggingface.co/spaces/ysharma
Apr 20, 2023 4 tweets 2 min read
今日AI领域大新闻速看
1Stability AI推出StableLM
2NVIDIA发布文本到视频论文
3Elon Musk威胁起诉Microsoft
4OpenAI更新API密钥造了Stable Diffusion的Stability AI刚刚发布了一套名为StableLM的开源大型语言模型(LLMs)。
这距离他们发布文本到图像生成AI模型SDXL的公开发布仅仅5天 NVIDIA发布了一篇引人注目的论文,详述了一种将文本描述转换为逼真视频的技术。这项技术有望为影视制作、广告创意和虚拟现实等领域带来革命性的变革。
Apr 14, 2023 6 tweets 1 min read
BabyAGI是一个用Python编写的智能任务管理示例。它通过OpenAI和Pinecone API来创建、排序和执行任务。系统的核心是根据之前任务的结果和预设目标来生成新任务。接着,脚本利用OpenAI的NLP技术按照目标生成新任务,并通过Pinecone存储和获取任务结果提供背景信息。这个项目是任务驱动自主代理的简化版。 BabyAGI 的工作原理是通过一个无限循环执行以下步骤:
1、从任务列表中提取第一个任务。
2、将任务发送给执行代理,执行代理使用 OpenAI 的 API 根据上下文完成任务。
3、丰富结果并将其存储在 Pinecone 中。
4、根据目标和之前任务的结果创建新任务,并根据优先级重新排序任务列表
Apr 14, 2023 4 tweets 1 min read
AutoGPT 的实现原理可以分为以下具体步骤:
1配置文件:用户根据需求创建一个配置文件(如 ai_settings.yaml),包含 AI 的名称、角色、目标、约束条件等信息。
2生成提示:根据配置文件和用户输入的问题,AutoGPT 生成一个提示(prompt),提示包括 AI 名称、角色、目标、约束条件、可用命令等内 Image 3 与 ChatGPT 交互:将生成的提示发送给 ChatGPT,并获取 AI 的回应。
4 解析回应:分析 AI 的回应,提取需要执行的命令和参数。例如,AI 返回的回应中可能包含执行 Google 搜索的命令。
5 执行命令:根据解析结果执行命令。这可能包括搜索网站、执行脚本、发送消息给 GPT Agent 等操作。
Apr 13, 2023 5 tweets 1 min read
ChatGPT 只是众多优秀 AI 工具中的一个小部分。
我每周都会搜索 100 多个新的 AI 工具,所以你不需要亲自去找。
这周有 10 个你可能从未听说过的超实用工具,全新推出: 1、Glass AI
输入任何医疗问题,生成完整的临床计划。
2、Plask
基于网络的3D动画编辑器和动作捕捉工具。
Apr 12, 2023 4 tweets 1 min read
这张图主要展示了AI领域各个层次的50家公司及其他相关实体,它们分布在不同的应用场景、技术栈和行业垂直领域。图中的企业和项目涵盖了从硬件、基础设施、数据处理,到AI模型训练、部署、监控等全方位的技术和服务。以下图中各部分的具体解释:顶部行列出了评估这些公司相关组织,如Forbes、Sequoia等 Image Enterprise Stack(企业技术栈):这两部分列出了应用于不同市场的AI公司。Consumer Uses部分关注面向个人用户的产品和服务,如娱乐、通用产品、生产力工具等。Enterprise Stack部分则涉及面向企业的技术解决方案,如销售与市场营销、客户支持、安全等。