歸藏(guizang.ai) Profile picture
关注人工智能、LLM 、 AI 图像视频和设计(Interested in AI, LLM, Stable Diffusion, and design) AIGC 周刊主理人|公众号:歸藏的AI工具箱
6 subscribers
Apr 9 9 tweets 4 min read
上周我写 MCP 教程的时候说,希望有大厂可以搞个一键安装的 MCP 商店

没想到这一天来的这么快

阿里云百炼平台推出了业界首个全生命周期MCP服务

企业、开发者甚至个人用户可以一键部署 MCP 服务,可视化构建 Agents!

👇下面写个简单的教程,这下你肯定可以学会了: Image 阿里百炼具体特点有:

一键部署:提供一键部署、无需运维的MCP服务
超多 MCP 供给:内置了 MCP 市场默认提供了相当多官方的 MCP 和三方 MCP
低成本服务托管:业级MCP服务托管,函数计算资源动态启用,弹性按量付费
全链路工具兼容:在智能体和工作流中快速引用MCP服务
Mar 31 9 tweets 3 min read
作为收集控,信息检索一直困扰我。

AI出现解决了查找问题,但AI知识库新难点变成了:如何快速导入已有知识和解析多种文件类型?

纳米AI通过非常骚的方式解决了这两大痛点。

👇下面是详细的介绍,其他做类似产品的人也可以参考 Image 快速导入

在导入数据的时候他们充分思考了我们日常工作的知识来源和沉淀的位置。

在个人知识库点添加内容你会发现,除了大家都会做的文件上传和网页解析之外,他们还做了直接导入收藏夹。

相信很多普通用户自己是没有专门的内容收藏工具的,基本都是建一个收藏夹文件然后将链接存进去,现在直接就能批量导入和解析。

而且还支持深度解析,不止可以处理网页的文字内容,里面的图片和图表内容也可以变成LLM可以理解的方式存储下来。Image
Mar 25 20 tweets 8 min read
来了!一套提示词帮你实现小红书、公众号封面自由

而且 Deepseek V3 也能用

这套提示词是模块化设计的,风格部分与其他部分解耦,可以说是产品化方案了。

👇下面是具体的使用方式 Image 不想等施工🚧的可以看这里:mp.weixin.qq.com/s/OFCgFrXNQgIT…
Mar 20 4 tweets 2 min read
我写了一套提示词帮大家从文档生成可视化网页,但对很多人来说还是有点难

主要是因为:
想要效果好必须用 Claude 3.7
还得将需要整理的内容复制或者整理到文档里面

当时发出来也希望大佬们可以搞个产品给大家用

发现秘塔已经搞定了,能一键生成可视化网页,非常强

下面是介绍和使用方法👇 Image 比如我最近一直在看 MCP 相关的内容,秘塔搭载了 Deepseek R1 的研究模式非常强大,搜索的结果非常全面。

但以往的话这种纯文本内容和表格其实不太方便理解,尤其是一些有阅读障碍的人,看到密密麻麻的字已经开始头疼了。

这个时候只需要点击回答底部的「生成互动网页按钮」就能打开一个新世界。

可以看到现在搜索结果已经变成了一个非常条理的网页,不再是一条线传下来全是文字,每个标题和要点的关系都很清晰还加上了图标辅助定位和理解。

相信相较于上面的文字大家都会更喜欢这个结果。
Image
Image
Mar 14 5 tweets 2 min read
发现夸克推出了 AI 超级框功能,顺便试了一下,这玩意现在已经这么强了吗?

你可以直接提出你的问题和需求,不需要思考比如该选什么模型和用什么工具这些本来不用你思考的问题。

直接帮你调用夸克非常完善的工具基建完成任务,甚至可以组合多个工具完成。

👇下面是具体的介绍和案例: Image 解决这个事情其实挺难的,因为需要模型去调用各种 Agents 工具完成任务。需要几个条件:

首先这个公司需要有各种基础工具的基建,比如健康类知识、比如办公软件基建;

另外需要有丰富且强大的模型生态,模型能力强但是无法调用工具也无法完成这些任务。

如果用这些条件一排除你会发现能做好这些事情的可能居然只有阿里了。

Qwen 系列模型目前非常强大和完善,无论是多模态还是推理都非常强,而且最新的qwq 32B 在支持推理的基础上还能调用工具。

夸克很早就在布局各种工具和信息,比如专门的健康类搜索,都是医生和药典信息,还有 AI PPT 功能模板丰富而且非常美观,里面有整整一页的各种工作和学习工具。
Mar 5 8 tweets 3 min read
最近很多人问我

为啥我用 Claude 写的应用就没那么漂亮?

所以教大家一些非常简单的技巧

用上了以后你也能搞定这么漂亮的界面

👇下面是具体的技巧和完整提示词 完整内容这里,懒得等施工可以看:mp.weixin.qq.com/s/tUOAfd4OI56Q…
Mar 5 16 tweets 3 min read
AI 大神 Andrej Karpathy 教你使用大语言模型

这次不讲原理,真的是个人都能看懂了

基本详细介绍了目前 LLM 最常见的几个功能的用法

比如总结内容、Python 解释器、Claude Artifacts、Cursor、NotebookLM、图片和视频生成等

翻译了一下视频,👇下面也有文字总结 总结书籍章节和文档

目的: 快速理解书籍、章节或文档的内容,尤其是复杂或较旧的文本。

工具: LLM,如 ChatGPT 或 Claude。

他的使用方法:将文本内容复制并粘贴到 LLM 中。
要求 LLM 总结内容。
在阅读全文之前,将摘要用作起点。
在阅读时提出问题以澄清理解。

益处:提高记忆保持率和理解力。
使复杂文本更易于访问。
鼓励参与具有挑战性的材料。
Feb 19 9 tweets 3 min read
Obsidian 加 Cursor 就是最强AI知识库!

最近发现用 Cursor 这些 AI IDE 可以完美充当 Obsidian 的 AI 辅助插件

写了个教程,主要是三个使用方式:

- 帮助你用模糊的问题检索你的笔记库
- 帮助你基于笔记库进行研究
- 帮你生成和修改笔记

下面是详细内容👇: Image 这里是完整的教程,需要有好的阅读体验和上下文的可以看这里:mp.weixin.qq.com/s/3mlhd5lRBSz3…
Feb 8 5 tweets 3 min read
节后开工,Deepseek爆火出圈,让许多人首次免费体验到顶级AI模型的震撼

巨大的流量带来了两类乱象:

API 购买和配置复杂
无良媒体和产品用蒸馏的 R1 版本欺骗用户

很多朋友找我问怎么才能简单方便的用到满血 R1,找了一圈发现还是纳米AI搜索靠谱

👇下面给不太了解 AI 的朋友解释一下: Image 一顿操作买了个 API

Deepseek R1 是开源的,所以在官方服务崩溃之后,很多第三方云服务商看到了机会,开始部署模型。

模型部署之后其实是需要一个前端界面去展示 API 的输出结果的,很多用户其实非常小白,可能对我们圈内人来说很正常的操作,然后使用对他们来说难如登天。

很多人一顿操作买了 API 之后才发现痛苦的旅程刚开始,API Key 是什么东西?我不是买了吗,为什么还需要客户端?这一堆东西我该填到哪?

所以对于小白用户来说最好还是有一个直接可以聊天的 ChatBot 客户端可以直接给他们用,纳米AI搜索这点就做的很好。

在纳米AI搜索使用满血的 Deepseek R1 只需要下面这几步:

下载纳米AI搜索 APP-点击导航栏的大模型-选择 Deepseek R1-联网满血版,开聊就行,如果需要联网搜索的话可以点击下方的联网搜索按钮。Image
Feb 4 8 tweets 2 min read
整理了一下各行业的专家使用 Open AI Deep Research 后的一些反馈和案例

希望可以对他擅长做的事情有一些参考

具体的引用来源在下面👇 Image 医学专家让 Deep Research 协助处理癌症病例,表示生成的报告无可挑剔

Jan 25 6 tweets 2 min read
怎么好几天了信息流上还全是Deepseek R1

R1给海外从业者和企业负责人带来的冲击太大了

昨晚有几件关于 R1 的事情导致了讨论继续发酵

👇下面有详细的来源引用 Image lmarena R1出分了,目前排第三仅次于两个Gemini模型,硬提示、编码、数学排第一

Jan 24 9 tweets 2 min read
Open AI 发布了 Operator

可以帮你操作浏览器的 AI Agents

目前只有美国 IP 的 Pro 用户才能使用

下面是一些官方介绍和体验案例,可能会帮你省 1500 Image Open AI 官方介绍

Operator 由一种名为计算机使用代理(CUA)的新模型驱动。

合了 GPT-4o 的视觉能力与通过强化学习实现的高级推理

经过训练可以与用户界面进行交互

遇到挑战或犯错,Operator 可以利用其推理能力进行自我纠正

Jan 22 6 tweets 2 min read
海螺语音上线,测试了一下这可能是国内最好的配音产品了

支持超过17 种语言的配音
多种情绪表达的精准控制
支持数百种音色库满足不同需求
音频质量真的非常高,清晰、自然
提供丰富的自定义选项

详细的测试结果在下面👇 海螺语音的功能真的很强大而且细致,有一个庞大的音色库支持超过17种语言,每种语言又有非常多的音色,再加上男声和女声还有年龄。

可以通过筛选找到你需要的任何身份和年龄背景的音色,比如我们的视频脚本需要一个年迈的有正义感的老人,就可通过这个筛选快速获取到。 Image
Jan 22 10 tweets 2 min read
华尔街日报对 Anthropic CEO 的访谈,透露了挺多内容的

- 即将推出网络访问功能
- Claude 即将实现双向语音交互
- 允许 Claude 跨项目记忆信息
- 不会单独推出推理模型
- 未来 2-3 年内,AI 模型将在工作能力超过所有人类
- 新模型 3-6 个月推出

下面是 Gemini 的详细总结👇 Image 1. 产品路线图与功能 (Product Roadmap & Features):

近期功能重点:
网络访问 (Web Access): 即将推出,是优先事项,尤其针对消费者和高级用户。Anthropic 在网络访问方面有独特的想法,区别于其他模型提供商。

语音模式 (Voice Mode): 最终将实现双向语音交互。目前 Claude 可以转录语音和朗读文本,但双向音频模式尚未实现,企业端需求较低,消费者端需求更高。

记忆功能 (Memory Feature): 即将到来,是虚拟协作愿景的重要组成部分,允许 Claude 跨项目记忆信息,类似于人类助手记住过往对话。

Reasoning Models (推理模型): 即将发布新的优秀模型,但拒绝透露具体细节和发布日期。Anthropic 对 reasoning models 的理解与传统观点不同,强调强化学习和模型的持续思考与反思能力。

非优先功能:
照片生成 (Photo Generation): 非优先事项,企业用例有限,安全和保障问题独特。如果消费者端需求足够大,可能会考虑与专业公司合作。

虚拟协作 (Virtual Collaborators):
是 Anthropic 的核心愿景,旨在打造能够像人类助手一样在电脑屏幕上完成各种任务的 AI 系统。
用户可以与虚拟助手对话并分配任务,任务可能持续一天甚至更长时间,助手能够自主分解和执行任务,并定期汇报。

虚拟协作是 "autonomous virtual collaborator" (自主虚拟协作器) 的早期体现,拥有虚拟操作人类的所有能力,预计今年上半年可能出现强大版本。
计算机使用功能是虚拟协作的早期实例化。
Jan 22 6 tweets 2 min read
我去,这下真的开启 AI 军备竞赛了

特朗普、孙正义、甲骨文 CEO、Sam 一起宣布了总投资 5000 亿美元的 AI 星际之门计划

详细信息我放下面👇

星际之门项目是一家新成立的公司

计划在未来四年内投资 5000 亿美元,为美国的 OpenAI 建设新的人工智能基础设施。

将立即开始部署 1000 亿美元。

Stargate 的初始股权投资者包括软银、OpenAI、甲骨文和 MGX。其中软银负责财务,OpenAI 负责运营。孙正义将担任主席一职。

Jan 21 10 tweets 3 min read
昨晚的信息流都被 DeepSeek 刷屏了

整理了一些大佬们对 R1 论文的发现 Image DeepSeek-R1开发过程中遇到的两个失败尝试,包括过程奖励模型(PRM)的尝试和蒙特卡洛树搜索(MCTS)的尝试

1. 过程奖励模型(PRM)的尝试
主要存在三个限制:
- 难以明确定义推理任务中的细粒度步骤
- 难以判断中间步骤是否正确
- 基于模型的PRM容易导致奖励欺骗(reward hacking)问题
结论:虽然PRM在重新排序和引导搜索方面表现不错,但收益有限,且增加了计算开销。

2. 蒙特卡洛树搜索(MCTS)的尝试
主要挑战:
- 与象棋等游戏相比,token生成的搜索空间呈指数级增长
- 需要设置节点扩展限制,可能导致陷入局部最优
- 价值模型的训练难度大,影响生成质量
- 难以复制AlphaGo通过价值模型迭代提升性能的成功经验
结论:MCTS虽然可以在推理阶段提升性能,但难以通过自搜索实现模型性能的迭代提升。
Jan 7 10 tweets 3 min read
50 系显卡价格发布了

5070算力相当于 4090,价格只有 4090 的三分之一! Image 突然犯病,什么美国队长 哈哈哈哈 Image
Jan 1 10 tweets 1 min read
开个帖子记录和回顾一下我和 AI 行业的 2024

- 模型层面的发展(LLM、视频、图像)
- 我最喜欢的AI产品创新
- 我目前用钱投票的所有AI产品 产业&模型

图像和视频领域出乎意料的快速发展,感谢Open AI在Sora发布时最后的良知爆发,多写了点架构的事情。
Dec 20, 2024 5 tweets 3 min read
Anthropic 几个核心创始人罕见的一起录了一个播客

详细介绍了他们如何认识然后产生共识最后迫不得已创建公司的事情

整理了一下核心内容笔记:

- 创始历程与动机
- 公司文化特点
- 几个联创展望未来
- 有趣的AI历史细节

里面很多以前没说过的事情,强烈建议看看 Image
Image
Image
Image
创始历程与动机

1. 个人背景与转折点:
- Jared 原本是物理学教授,被Dario展示的AI模型结果所吸引
- Chris最早19岁就认识了团队成员,后来在Google Brain与Dario共事
- Tom原本是记者,2014年就开始关注AI发展,尽管当时很多人认为这个决定"疯狂"
- Daniela在Stripe工作了5.5年,经Greg介绍认识了团队

2. 关键时间节点:
- 2014-2015: Tom开始追踪ImageNet结果,注意到GPU在AI研究中的重要性
- 2015: Dario发表"Concrete Problems in AI Safety"论文,开创性地将AI安全与实际机器学习结合
- 2016: 多位成员加入OpenAI
- 2020: GPT-3成功后,团队意识到必须采取行动
- 2020-2021: 团队决定离开OpenAI创立Anthropic

3. 决策过程:
- Chris描述自己花了6个月时间纠结是否要投身AI安全领域
- Tom采用了一个有趣的策略:向雇主提出不可能被接受的条件,帮助自己下定决心
- 有些成员(如Chris)最初不想成立新公司,更倾向于建立非营利组织
- 最终选择创业是出于实用主义考虑,认识到需要资本支持

4. 核心动机:
- "None of us wanted to found a company. We felt like it was our duty."(没人想创业,但我们觉得这是责任)
- 看到GPT-3的成功后,意识到如果不采取行动,可能会错过改变行业的机会
- 希望避免科技行业常见的错误,建立一个不同的机构文化
- 团队成员共同特点是"betting with conviction"(带着信念下注)

5. 独特视角:
- 物理学家背景带来的影响:更愿意追求雄心勃勃的目标,不受AI寒冬的心理阴影影响
- 新闻记者背景带来的洞察:能够较早发现技术趋势
- 工程师视角的重要性:认识到不仅研究者,工程师也能为AI安全做出贡献
Dec 14, 2024 4 tweets 2 min read
Ilya 罕见发声在 2024 年 Neurips 大会上演讲

“我们所熟知的预训练将会终结”

大致介绍了:

- 深度学习的演进
- 为什么预训练已经达到上限
- 未来的发展方向
- 对超级智能的思考

我转录总结了后面三个部分,文字版本在下面 Image
Image
Image
预训练终结预测的关键论点:

1. 预训练终结的必然性
演讲者明确表示:"预训练将毫无疑问地结束"(Pre-training as we know it will unquestionably end)

2. 终结的核心原因:计算力与数据的不平衡发展

a) 计算能力方面持续增长:
- 硬件性能不断提升
- 算法效率持续改进
- 计算集群规模扩大
- 这些因素共同推动计算能力的指数级增长

b) 数据增长的天然限制:
- "我们只有一个互联网"(we have but one internet)
- 可用的优质数据是有限的
- 演讲者用了一个形象的比喻:"数据是AI的化石燃料"(data is the fossil fuel of AI)
- 就像化石燃料一样,数据是在特定时期产生的有限资源
- 我们已经达到了"峰值数据"(peak data)的状态

3. 数据限制的影响
- 虽然现有数据仍然可以支持相当长一段时间的发展
- 但最终必须面对数据量增长有限的现实
- 需要寻找新的解决方案和发展方向
Dec 2, 2024 10 tweets 2 min read
黑五最后一天了,整理了一下打折的 AI 软件内容。

看看有需要的可以赶快下手。 Image Perplexity 黑五优惠首月只需 5 美元。另外如果你朋友是会员的话,他可以免费送你一个月的会员。

Windsurf 将所有免费用户的试用期延长到了 12 月 11 号。

Screen Studio 我常用的视频剪辑和录制软件,使用BLACKFRIDAY24这个优惠代码可以获得40% 的优惠。

Monica 年卡超级会员4折$119,原价299,周末放出了会员群专属的优惠券可以实现折上折。

推特6折 5.4美元年会员,原价84,只能首次订阅的用户享受。

Suno月卡6折6$,原价10。

Framer基本版、专业版和启动版首年5折,只有首次订阅用户可以享受。

Recraft年度7折,月度3折(BLACKYEAR70/BLACKMONTH30 )

可灵海外版现在也有5折优惠。

桌面快捷启动器Raycast使用代码BF30可以优惠30%。

Bolt 结账时使用 CYBERBOLT 代码可以获得10%的优惠。

写作笔记软件Craft 5折,后续续费也是五折,很值。

AI 画图工具 Ideogram 5 折。

Lummi AI 图片素材库,年订阅用户打 5 折。