Latest Twitter Threads by @op7418 on Thread Reader App

Jul 2 • 19 tweets • 5 min read

这周藏师傅呕心沥血的大活来了！

Gemini CLI 不写代码帮普通人提效的的一万种用法！

- 如何低门槛两步用上 Gemini CLI
- 批量修改系统设置
- 编辑查找文档，生成 PPT
- 剪辑视频、修改图片、下载视频
-不同文档格式的互转等等

下面是详细的教程和案例🧵

等不及施工的可以先收藏

或者直接看这里：mp.weixin.qq.com/s/Frdf_Gh3Xhvv…

Jun 18 • 15 tweets • 4 min read

来了！从案例分析到提示词写作

藏师傅手把手教你制作最火爆的 Veo3 AI视频

不只教你如何用视频模型，还会教你用各种工具分析视频从而生成新的创意，给你提示词模板。

让你从创意到生成全部自动化。甚至可以用来做视频 Agent 产品

先谢谢各位的转发和赞，我们开始👇

https://twitter.com/op7418/status/1935210757198856664

等不及施工🚧的可以看这里：

mp.weixin.qq.com/s/tRoEKCsZBBTE…

May 27 • 8 tweets • 3 min read

老是问我有没有国内能用的 Vibe Coding 产品，这次真有了！

美团除了一个叫 Nocode 的产品

不止能写展示类的网页，相当复杂的多页面完整产品他也能一次性搞定

比如这个逻辑非常复杂仓库商品管理工具，居然一次就搞定了

👇下面是详细测试和介绍

先来看一下产品能力：

支持通过提示词提出要求后生成网页应用

支持 AI 自动优化和发现问题，不需要详细描述自己会分析 bug 原因

支持对提示词词进行优化，帮你梳理需求

支持快速将生成的网页服务部署上线，还有专属域名（早来可以占上）

支持 Dev Mode 模式，用类似 Cursor 的在线工具编写代码

支持 DateBase，让你的用 AI 生成的产品不再是玩具，可以存储、管理巨量信息

May 21 • 14 tweets • 6 min read

开个帖子详细记录一下谷歌昨晚所有的发布

内容量要爆炸了，每个模型都有大幅提升

- Gemini 2.5 Pro Deep Think 模式
- Veo 3视频模型
- Imagen 4图像模型
- FLOW AI剪辑工具
- 谷歌搜索 AI 模式

👇是所有内容：

AI 模式即将面向美国所有用户推出。

它对搜索功能进行了彻底的重构，拥有更先进的推理能力，可以提出更长、更复杂的查询。

May 6 • 13 tweets • 4 min read

写了一篇详细的教程

教大家如何生成这种一图流模型或者产品介绍宣传图

顺便教一下怎么用 Figma 修改从网页生成的图片

如果等不及施工可以看这里：mp.weixin.qq.com/s/uQQ7R8rBUXZ6…

Apr 22 • 11 tweets • 5 min read

Trae 更新 MCP 和 Agent 能力，这次更新强度拉满了

尤其是 Agent 支持组合 MCP 和提示词能搞各种花活

趁着这次更新我也写了一下我是如何进行 AI 编程（Vibe Coding）的

里面有很多小技巧，顺便教大家用 Trae

还有藏师傅的 15 条 Vibe Coding 建议先掏出来

详细教程和 Trae 更新介绍在下面👇

先看一下Trae 发布了四大重磅功能

现在其能力已与 Cursor、Windsurf 看齐、甚至体验更胜一筹。例如可以自定义智能体，配合上MCP和prompt，能一次集结多个专属AI专家，为我所用。

智能体创建：支持基于提示词和MCP工具自定义智能体，@即可使用，不需要每次都输入复杂指令

智能工具（MCP）：支持MCP，而且内置了常用的，只需要点击即可使用

更多上下文：新增联网搜索和文档集上下文理解能力，可以让AI搜索不懂的编码框架和文档了

个人/项目规则：支持配置个人规则和项目规则，不需要反复强调基础的编码要求

Apr 15 • 4 tweets • 1 min read

兄弟们，我好像搞了个不得了的东西

自动获取你的位置、天气、当地新闻和你昨天收藏的文章，为你生成一个编排好的播客网页

你可以直接看内容也可以收听为你定制的播客

有朋友感兴趣的话我找时间写写

现在人人都可以自定义自己的 Agents 了，MCP 铺开以后想象力非常大

Apr 9 • 9 tweets • 4 min read

上周我写 MCP 教程的时候说，希望有大厂可以搞个一键安装的 MCP 商店

没想到这一天来的这么快

阿里云百炼平台推出了业界首个全生命周期MCP服务

企业、开发者甚至个人用户可以一键部署 MCP 服务，可视化构建 Agents！

👇下面写个简单的教程，这下你肯定可以学会了：

阿里百炼具体特点有：

一键部署：提供一键部署、无需运维的MCP服务
超多 MCP 供给：内置了 MCP 市场默认提供了相当多官方的 MCP 和三方 MCP
低成本服务托管：业级MCP服务托管，函数计算资源动态启用，弹性按量付费
全链路工具兼容：在智能体和工作流中快速引用MCP服务

Mar 31 • 9 tweets • 3 min read

作为收集控，信息检索一直困扰我。

AI出现解决了查找问题，但AI知识库新难点变成了：如何快速导入已有知识和解析多种文件类型？

纳米AI通过非常骚的方式解决了这两大痛点。

👇下面是详细的介绍，其他做类似产品的人也可以参考

快速导入

在导入数据的时候他们充分思考了我们日常工作的知识来源和沉淀的位置。

在个人知识库点添加内容你会发现，除了大家都会做的文件上传和网页解析之外，他们还做了直接导入收藏夹。

相信很多普通用户自己是没有专门的内容收藏工具的，基本都是建一个收藏夹文件然后将链接存进去，现在直接就能批量导入和解析。

而且还支持深度解析，不止可以处理网页的文字内容，里面的图片和图表内容也可以变成LLM可以理解的方式存储下来。

Mar 25 • 20 tweets • 8 min read

来了！一套提示词帮你实现小红书、公众号封面自由

而且 Deepseek V3 也能用

这套提示词是模块化设计的，风格部分与其他部分解耦，可以说是产品化方案了。

👇下面是具体的使用方式

https://twitter.com/op7418/status/1904135409942335585

不想等施工🚧的可以看这里：mp.weixin.qq.com/s/OFCgFrXNQgIT…

Mar 20 • 4 tweets • 2 min read

我写了一套提示词帮大家从文档生成可视化网页，但对很多人来说还是有点难

主要是因为：
想要效果好必须用 Claude 3.7
还得将需要整理的内容复制或者整理到文档里面

当时发出来也希望大佬们可以搞个产品给大家用

发现秘塔已经搞定了，能一键生成可视化网页，非常强

下面是介绍和使用方法👇

比如我最近一直在看 MCP 相关的内容，秘塔搭载了 Deepseek R1 的研究模式非常强大，搜索的结果非常全面。

但以往的话这种纯文本内容和表格其实不太方便理解，尤其是一些有阅读障碍的人，看到密密麻麻的字已经开始头疼了。

这个时候只需要点击回答底部的「生成互动网页按钮」就能打开一个新世界。

可以看到现在搜索结果已经变成了一个非常条理的网页，不再是一条线传下来全是文字，每个标题和要点的关系都很清晰还加上了图标辅助定位和理解。

相信相较于上面的文字大家都会更喜欢这个结果。

Mar 14 • 5 tweets • 2 min read

发现夸克推出了 AI 超级框功能，顺便试了一下，这玩意现在已经这么强了吗？

你可以直接提出你的问题和需求，不需要思考比如该选什么模型和用什么工具这些本来不用你思考的问题。

直接帮你调用夸克非常完善的工具基建完成任务，甚至可以组合多个工具完成。

👇下面是具体的介绍和案例：

解决这个事情其实挺难的，因为需要模型去调用各种 Agents 工具完成任务。需要几个条件：

首先这个公司需要有各种基础工具的基建，比如健康类知识、比如办公软件基建；

另外需要有丰富且强大的模型生态，模型能力强但是无法调用工具也无法完成这些任务。

如果用这些条件一排除你会发现能做好这些事情的可能居然只有阿里了。

Qwen 系列模型目前非常强大和完善，无论是多模态还是推理都非常强，而且最新的qwq 32B 在支持推理的基础上还能调用工具。

夸克很早就在布局各种工具和信息，比如专门的健康类搜索，都是医生和药典信息，还有 AI PPT 功能模板丰富而且非常美观，里面有整整一页的各种工作和学习工具。

Mar 5 • 8 tweets • 3 min read

最近很多人问我

为啥我用 Claude 写的应用就没那么漂亮？

所以教大家一些非常简单的技巧

用上了以后你也能搞定这么漂亮的界面

👇下面是具体的技巧和完整提示词

完整内容这里，懒得等施工可以看：mp.weixin.qq.com/s/tUOAfd4OI56Q…

Mar 5 • 16 tweets • 3 min read

AI 大神 Andrej Karpathy 教你使用大语言模型

这次不讲原理，真的是个人都能看懂了

基本详细介绍了目前 LLM 最常见的几个功能的用法

比如总结内容、Python 解释器、Claude Artifacts、Cursor、NotebookLM、图片和视频生成等

翻译了一下视频，👇下面也有文字总结

https://twitter.com/karpathy/status/1895242932095209667

总结书籍章节和文档

目的：快速理解书籍、章节或文档的内容，尤其是复杂或较旧的文本。

工具： LLM，如 ChatGPT 或 Claude。

他的使用方法：将文本内容复制并粘贴到 LLM 中。
要求 LLM 总结内容。
在阅读全文之前，将摘要用作起点。
在阅读时提出问题以澄清理解。

益处：提高记忆保持率和理解力。
使复杂文本更易于访问。
鼓励参与具有挑战性的材料。

Feb 19 • 9 tweets • 3 min read

Obsidian 加 Cursor 就是最强AI知识库！

最近发现用 Cursor 这些 AI IDE 可以完美充当 Obsidian 的 AI 辅助插件

写了个教程，主要是三个使用方式：

- 帮助你用模糊的问题检索你的笔记库
- 帮助你基于笔记库进行研究
- 帮你生成和修改笔记

下面是详细内容👇：

这里是完整的教程，需要有好的阅读体验和上下文的可以看这里：mp.weixin.qq.com/s/3mlhd5lRBSz3…

Feb 8 • 5 tweets • 3 min read

节后开工，Deepseek爆火出圈，让许多人首次免费体验到顶级AI模型的震撼

巨大的流量带来了两类乱象：

API 购买和配置复杂
无良媒体和产品用蒸馏的 R1 版本欺骗用户

很多朋友找我问怎么才能简单方便的用到满血 R1，找了一圈发现还是纳米AI搜索靠谱

👇下面给不太了解 AI 的朋友解释一下：

一顿操作买了个 API

Deepseek R1 是开源的，所以在官方服务崩溃之后，很多第三方云服务商看到了机会，开始部署模型。

模型部署之后其实是需要一个前端界面去展示 API 的输出结果的，很多用户其实非常小白，可能对我们圈内人来说很正常的操作，然后使用对他们来说难如登天。

很多人一顿操作买了 API 之后才发现痛苦的旅程刚开始，API Key 是什么东西？我不是买了吗，为什么还需要客户端？这一堆东西我该填到哪？

所以对于小白用户来说最好还是有一个直接可以聊天的 ChatBot 客户端可以直接给他们用，纳米AI搜索这点就做的很好。

在纳米AI搜索使用满血的 Deepseek R1 只需要下面这几步：

下载纳米AI搜索 APP-点击导航栏的大模型-选择 Deepseek R1-联网满血版，开聊就行，如果需要联网搜索的话可以点击下方的联网搜索按钮。

Feb 4 • 8 tweets • 2 min read

整理了一下各行业的专家使用 Open AI Deep Research 后的一些反馈和案例

希望可以对他擅长做的事情有一些参考

具体的引用来源在下面👇

医学专家让 Deep Research 协助处理癌症病例，表示生成的报告无可挑剔

https://x.com/DeryaTR_/status/1886243919828254944

Jan 25 • 6 tweets • 2 min read

怎么好几天了信息流上还全是Deepseek R1

R1给海外从业者和企业负责人带来的冲击太大了

昨晚有几件关于 R1 的事情导致了讨论继续发酵

👇下面有详细的来源引用

lmarena R1出分了，目前排第三仅次于两个Gemini模型，硬提示、编码、数学排第一

https://x.com/lmarena_ai/status/1882749951924715578

Jan 24 • 9 tweets • 2 min read

Open AI 发布了 Operator

可以帮你操作浏览器的 AI Agents

目前只有美国 IP 的 Pro 用户才能使用

下面是一些官方介绍和体验案例，可能会帮你省 1500

Open AI 官方介绍

Operator 由一种名为计算机使用代理（CUA）的新模型驱动。

合了 GPT-4o 的视觉能力与通过强化学习实现的高级推理

经过训练可以与用户界面进行交互

遇到挑战或犯错，Operator 可以利用其推理能力进行自我纠正

Jan 22 • 6 tweets • 2 min read

海螺语音上线，测试了一下这可能是国内最好的配音产品了

支持超过17 种语言的配音
多种情绪表达的精准控制
支持数百种音色库满足不同需求
音频质量真的非常高，清晰、自然
提供丰富的自定义选项

详细的测试结果在下面👇

https://twitter.com/Hailuo_AI/status/1879554062993195421

海螺语音的功能真的很强大而且细致，有一个庞大的音色库支持超过17种语言，每种语言又有非常多的音色，再加上男声和女声还有年龄。

可以通过筛选找到你需要的任何身份和年龄背景的音色，比如我们的视频脚本需要一个年迈的有正义感的老人，就可通过这个筛选快速获取到。

Jan 22 • 10 tweets • 2 min read

华尔街日报对 Anthropic CEO 的访谈，透露了挺多内容的

- 即将推出网络访问功能
- Claude 即将实现双向语音交互
- 允许 Claude 跨项目记忆信息
- 不会单独推出推理模型
- 未来 2-3 年内，AI 模型将在工作能力超过所有人类
- 新模型 3-6 个月推出

下面是 Gemini 的详细总结👇

1. 产品路线图与功能 (Product Roadmap & Features):

近期功能重点:
网络访问 (Web Access): 即将推出，是优先事项，尤其针对消费者和高级用户。Anthropic 在网络访问方面有独特的想法，区别于其他模型提供商。

语音模式 (Voice Mode): 最终将实现双向语音交互。目前 Claude 可以转录语音和朗读文本，但双向音频模式尚未实现，企业端需求较低，消费者端需求更高。

记忆功能 (Memory Feature): 即将到来，是虚拟协作愿景的重要组成部分，允许 Claude 跨项目记忆信息，类似于人类助手记住过往对话。

Reasoning Models (推理模型): 即将发布新的优秀模型，但拒绝透露具体细节和发布日期。Anthropic 对 reasoning models 的理解与传统观点不同，强调强化学习和模型的持续思考与反思能力。

非优先功能:
照片生成 (Photo Generation): 非优先事项，企业用例有限，安全和保障问题独特。如果消费者端需求足够大，可能会考虑与专业公司合作。

虚拟协作 (Virtual Collaborators):
是 Anthropic 的核心愿景，旨在打造能够像人类助手一样在电脑屏幕上完成各种任务的 AI 系统。
用户可以与虚拟助手对话并分配任务，任务可能持续一天甚至更长时间，助手能够自主分解和执行任务，并定期汇报。

虚拟协作是 "autonomous virtual collaborator" (自主虚拟协作器) 的早期体现，拥有虚拟操作人类的所有能力，预计今年上半年可能出现强大版本。
计算机使用功能是虚拟协作的早期实例化。

Share this page!

Enter URL or ID to Unroll