给 Agent 做工具，可能比给人做工具更像下一代 SaaS

一个截图工具，突然让我重新理解 SaaS

我最近越来越觉得，CLI 这东西可能又要性感回来了。

这句话放在几年前，多少有点像工程师自嗨。黑窗口、命令、参数、报错，怎么听都不像一个“下一代 SaaS”的开头。过去几年我们聊 SaaS，聊得最多的是界面、转化、onboarding、dashboard、模板、协作和留存。用户进来以后，怎么让他少想一点，多点几下，最好第二天还能回来。

这个逻辑当然没错。人用软件，体验就是很重要。然而现在连我都天天离不开各种 CLI，已经是最好的证明。

但最近我看到 Apple Frames 4 的更新，突然觉得有些工具的用户可能已经不只是人了。Apple Frames 这个产品本来很具体，就是给苹果设备截图套官方风格的设备边框。设计师、写作者、开发者会用，但你很难说它是什么改变世界的大平台。

有意思的是，这次它不只是更新了 Shortcut，不只是加了多色设备边框和比例缩放，还发布了开源的 Apple Frames CLI。更关键的是，我去看了 MacStories 原文，确认这不是 Redol 摘要里的误读。原文明确说，Apple Frames CLI 是给 AI agents 使用的，并且带 Claude Code/Codex skill，可以让 coding agents 从 Mac 的任意文件夹里批量处理几十张甚至上百张截图。作者 Federico Viticci 还说，这个 CLI 本身就是他用 Claude Code 和 Codex 做出来的，并且已经能放进 Claude Code 测试 iOS app、截图、套框的同一条 agentic workflow 里。

一个截图加框工具，搞 CLI，搞 agent skill，还要让 Claude Code 和 Codex 能直接调用。

这件事小吗？小。

但它很有代表性。因为它说明软件工具正在开始认真服务一种新用户。这个用户不是坐在屏幕前点按钮的人，而是 Agent。不是宣传片里穿西装走来走去的“智能体”，也不是 PPT 里画得天花乱坠的平台概念。就是很具体的 Claude Code、Codex、Cursor、各种自动化脚本和工作流里的那个执行者。

它不会欣赏你的按钮漂不漂亮，不关心你的空状态页面有没有温度，也不会因为你用了一个很高级的渐变色，就觉得这个产品更值得付费。它关心的是这个工具能不能被调用，输入是不是稳定，输出是不是清楚，报错以后能不能判断哪里错了，有没有权限边界，能不能重复执行，失败以后能不能恢复，整个过程能不能留下记录。

说实话，如果这个趋势继续往前走，SaaS 的一部分价值判断会被重新洗一遍。

人用软件，和 Agent 用软件，不是一回事

以前我们做工具，默认是给人做。

给人做工具，核心是降低人的操作成本。界面要清楚，路径要短，按钮要好找，反馈要及时，审美不能太拉胯，最好还要有一点“我很懂你”的产品气质。用户从首页进来，注册，登录，看导航，点菜单，试功能，遇到问题再问客服。这个过程里，产品经理有很多发挥空间。你可以用交互引导，可以做模板，可以做案例，可以做可视化，也可以把复杂流程藏起来。

但 Agent 用你的工具，通常不是这样。

它可能是在一个长任务中间被调用。前面已经跑了几十步，后面还有几十步。它只需要把一张图处理好，把一批数据清洗好，把一个页面检测好，把一份 Markdown 转成 HTML，把一个报告生成 JSON，把一篇文章上传到草稿箱。它没有心情欣赏你，它只想知道一件事：这个任务交给你，能不能稳稳地回来。

这就是我觉得“给 Agent 做工具，可能比给人做工具更像下一代 SaaS”的原因。

这句话不是说以后不需要 UI 了。别误会。人类永远还是要配置目标、审批权限、验收结果、处理异常、掏钱续费。没有人类，软件商业就没了。至少目前还没到 AI 自己刷信用卡买 SaaS 的阶段，真到了那天，Stripe 估计也要先开个会。

我想说的是，SaaS 的一个新入口正在出现。过去 SaaS 争的是用户登录以后能不能留下来。以后有一类 SaaS 争的可能是，用户根本不用登录你，但他的 Agent 会不会一次又一次把任务交给你。

这个变化有点反直觉。

以前产品经理会焦虑 DAU、留存、页面停留时间、功能点击率。但在 Agent 工作流里，用户越喜欢你，可能越不想打开你。因为他希望你安静地把事办完。一个真正好用的基础设施，不需要你每天打开它，夸它今天界面真好看。你只希望它不掉链子。

这对做 SaaS 的人来说，挺残酷，也挺有机会。

残酷的地方在于，过去你靠界面占据用户注意力，以后用户可能直接绕过界面。机会在于，只要你能成为任务链里的可靠节点，用户不天天打开你，也可能天天依赖你。

你不一定占据注意力，但你占据任务链。

这两种价值不一样。注意力价值适合内容、社区、平台和消费级产品。任务链价值更适合工具、基础设施、垂直 SaaS 和自动化节点。很多普通创业者真正该想的，可能不是“我要不要做下一个 Notion”，而是“我能不能成为某类 Agent 工作流里最可靠的那一步”。

我自己的卡点：SERP API 又贵，又离不开

这件事我最近在自己规划每日网站博客文章自动更新任务时，感受特别明显。

如果只是让人做内容规划，人可以打开 Google，搜几个关键词，看几个页面，大概判断一下搜索意图、竞品标题、内容深度和页面类型。这个过程很慢，但人可以忍受。浏览器里有广告，有跳转，有地区差异，有各种乱七八糟的 SERP 组件，人靠经验还能凑合判断。

但一旦你想让 Agent 稳定做这件事，问题就完全不一样了。

Agent 不能只靠“我感觉 Google 结果差不多是这样”。它要稳定的 SERP 数据，要知道前十名页面是谁，标题是什么，摘要是什么，有没有广告，有没有 AI Overview，有没有 Reddit、YouTube、Shopping、People Also Ask 这些模块。它还要能反复跑，今天跑、明天跑、换关键词跑、换国家跑、换语言跑。

这时候最讨厌的东西来了：SERP API。

我最烦它，真的。为了得到稳定的 SERP 数据，又不得不用它。可是用了以后，又觉得价格实在太贵。1000 个搜索就要 25 美金。人手动查 20 个关键词，只是累一点；Agent 如果放开去跑，20 个主题，每个主题拆 5 个搜索变体，再做几轮验证，成本一下子就开始冒烟。

这就是一个非常典型的 Agent 工具问题。

从人的视角看，搜索引擎页面是免费的。你打开浏览器，输入关键词，看结果，顶多花时间。从 Agent 的视角看，稳定、可解析、可重复的 SERP 数据不是免费的，它是一种基础设施。你可以讨厌它贵，但只要你想让任务稳定跑，就会发现自己离不开它。

这个例子比很多宏大叙事都扎实。

因为它把问题说清楚了：Agent 时代的工具价值，很多时候不是“有没有一个漂亮后台”，而是“能不能把一个原本不稳定、不可控、靠人经验凑合的动作，变成稳定、可调用、可计费、可审计的能力”。

SERP API 为什么能收费？不是因为它界面好看。它收费，是因为它把混乱的搜索结果，变成 Agent 能吃的结构化数据。你觉得贵，说明成本真实存在；你又不得不用，说明价值也真实存在。

这就是下一代 SaaS 很可能出现的地方。

不是所有机会都长得像一个新平台。有些机会就长在这种很烦、很贵、很基础，但一旦自动化就绕不开的地方。

老东西重新排队：API、CLI、权限和日志

所以我不太愿意把“Agent 原生工具”讲得太玄。

这不是什么凭空冒出来的新魔法。Agent 时代很多所谓新东西，其实都是老东西重新排队。API 不是新东西，CLI 不是新东西，Webhook 不是新东西，自动化脚本不是新东西，插件生态也不是新东西。

新的是，过去这些东西主要服务工程师和高级用户，现在它们开始服务 AI。或者说，AI 让更多普通用户间接用上了这些原本偏工程化的能力。

以前一个非技术用户不会写脚本，就很难把十个工具串起来。现在他可以说一句“帮我把今天的网站博客选题规划出来，查 SERP，筛关键词，生成文章框架，再写进我的内容表”，Agent 就会尝试调用背后的一堆工具。

但它能不能调用成功，取决于这些工具有没有为“非人类调用者”留路。

一个 SaaS 只有网页按钮，没有 API，没有稳定导出，没有清楚的错误反馈，没有权限粒度，没有批处理能力，那么它对人来说也许很好用，但对 Agent 来说很难用。反过来，一个工具即使界面很朴素，只要能力足够清楚，接口足够稳定，输出足够干净，它就很容易被塞进各种 Agent 工作流里。

这也是 Apple Frames CLI 这个小例子让我在意的原因。

它不是因为“截图加框”这个动作多伟大，而是因为它把一个原本可以由人手动完成的动作，做成了 Agent 能调用的能力。截图在哪里，怎么识别设备尺寸，输出到哪里，怎样批量处理，怎样被 Claude Code/Codex 的 skill 理解，这些东西一旦清楚了，它就可以进入别人的工作流。

这才是重点。

给人做工具，你要让人觉得舒服。给 Agent 做工具，你要让系统觉得放心。舒服靠界面和体验，放心靠结构和边界。

这里面有很多过去看起来不性感的东西：稳定输入、结构化输出、退出码、错误码、日志、幂等、权限、审计、任务状态、可恢复流程。以前它们是在后台默默重要，前台负责卖相，后台负责兜底。到了 Agent 时代，它们可能会变成产品本身的一部分。

更准确地说，它们会变成产品能不能被 Agent 信任的理由。

普通开发者的机会，不在大而全

这就会带来一个很现实的创业问题：普通开发者还有没有机会？

我觉得有，但机会大概率不在“再做一个大而全的 AI SaaS”。这条路太重了。你要做账号系统，要做 billing，要做团队协作，要做权限，要做 dashboard，要做一堆模型接入，要做客服，还要和巨头卷渠道。最后产品看起来很完整，结果用户进来问一句：你和 ChatGPT Plus 有什么区别？

这个问题挺扎心的。

但如果换一个角度，机会会清楚很多。普通开发者可以做一块很窄、很稳、很好被 Agent 调用的小能力。不要一上来就想做“AI 内容平台”，可以先做一个能把 Markdown 稳定转成公众号 HTML 的工具。不要一上来就想做“AI SEO 全家桶”，可以先做一个能把页面抓取、标题描述检查、schema 检查、图片 alt 检查稳定吐成 JSON 的工具。不要一上来就想做“AI 电商运营平台”，可以先做一个能把商品图片处理、文件命名、alt 文案、Shopify 草稿创建稳定跑通的小工具。

这些东西单独拿出来，都不像一个巨大的 SaaS，甚至有点土。但它们都有一个共同点：它们是工作流里的可调用能力。

而可调用能力，在 Agent 时代可能会比一个漂亮后台更值钱。

过去很多 SaaS 的商业价值，来自于“把人留在我的系统里”。你登录我的后台，上传你的数据，在我的页面里协作，在我的 dashboard 里看结果，在我的生态里完成任务。这是一种很典型的平台思维。

但 Agent 工作流会反过来挑战这件事。用户可能不想进入你的系统，他只想把一个任务交给 Agent，然后 Agent 在背后调用十几个系统。你的产品只是其中一个节点。这听起来好像存在感变低了，但商业价值未必低。

因为当你成为某个关键节点以后，用户依赖的不是你的界面，而是你的能力稳定性。他不天天打开你，但他的流程天天调用你。

这也是为什么我觉得未来会出现一种很重要的形态，可以暂时叫 capability SaaS。

它不是卖一个完整系统，而是卖一个清楚、稳定、可调用、可计费的小能力。这个能力可以被人用，也可以被 Agent 用。人用的时候，它有一个简单界面；Agent 用的时候，它有 API、CLI、MCP server、schema、日志、权限和状态回调。人看到的是结果，Agent 看到的是接口，公司买单，买的是这个能力能不能长期嵌在自己的流程里。

这对独立开发者其实是好消息。

不是每个人都有资源做大平台，但很多人可以做一个窄能力。甚至越窄越好。宽了，你竞争不过大厂；窄了，你可以更懂场景，更懂失败点，更懂用户愿意为什么付钱。

跨境独立站的 AI 可读页面审计，公众号作者的 Markdown 到微信 HTML 稳定排版，Shopify 卖家的商品图处理和上架前检查，SEO 团队的 SERP 数据清洗和 AI 搜索引用监测，开发者的截图、录屏、发布说明、文档图片自动化处理，这些都不是“宇宙级平台”。但它们有一个共同特点：人不想反复做，Agent 又很适合做，中间就需要工具。

这就是机会。

但别把它吹成万能机会

当然，也别把这件事吹过头。

给 Agent 做工具，不等于你随便写个 API 就能赚钱。这里面有几个很现实的坑。

分发是第一关。Agent 能调用你，不代表用户知道你。你还是要解决获客。可能是 SEO，可能是开发者社区，可能是模板生态，可能是被主流 Agent 平台收录，也可能是靠开源工具切进去。标准是第二关。今天大家都在讲 MCP、tools、skills、API、workflow，但标准还在变。你做得太早，可能会踩接口变化；做得太晚，可能入口已经被别人占了。

信任是第三关。Agent 调用工具，其实是在把一部分执行权交出去。如果你的工具处理的是文件、账号、客户数据、发布权限、支付动作，用户会非常谨慎。计费是第四关。以前 SaaS 可以按 seat 收费，Agent 工具可能更适合按任务、调用量、处理量、结果质量、工作流节点收费。但这套账怎么让用户觉得合理，还需要摸。

还有可替代性。如果你的能力太简单，大模型自己就能做，或者用户用几行脚本就能替代，那就很难收钱。你必须在稳定性、场景理解、合规、集成、交付质量上有一点门槛。

所以这个方向不是“人人都能发财”。我最烦这种话。

它更像一个提醒：如果你现在想做 AI 工具，不要只盯着聊天界面和大而全平台。你可以回头看看那些被人嫌弃“不性感”的环节。文件处理、格式转换、发布前检查、截图生成、数据清洗、页面审计、权限控制、日志整理、报告输出，这些东西过去像边角料，但在 Agent 工作流里，边角料可能就是必经路口。

谁守住路口，谁就有机会收过路费。当然，这个“过路费”不能靠卡脖子收。真靠卡脖子，用户迟早绕过去。它要靠稳定、便宜、省心、可控。

这就是工具型 SaaS 的老逻辑。

AI 没有改变这个老逻辑。它只是让这个老逻辑重新变得显眼。

别只给人做按钮，也给 Agent 留一条路

所以回到标题。

为什么我说，给 Agent 做工具，可能比给人做工具更像下一代 SaaS？

因为当 Agent 成为执行者，SaaS 的价值会从“让人舒服地操作”扩展到“让任务可靠地完成”。当用户不再亲自点每一步，产品的可调用性、可恢复性、可审计性就会变成体验的一部分。当越来越多工作流由 Agent 串起来，一个小工具只要足够可靠，就可能成为很多流程里的固定节点。

这不是一个特别浪漫的未来，甚至有点朴素。下一代 SaaS 不一定每个都像科幻电影。很多可能就是一个稳定的接口，一个干净的 JSON，一个可靠的命令，一个权限边界很清楚的小工具。

但商业机会很多时候就是这样。

不是哪里最热闹，哪里就最有钱。有时候，真正有价值的地方，是别人觉得太小、太碎、太不性感，于是懒得认真做。等 Agent 真开始干活，这些小地方就会突然变成基础设施。

我现在越来越相信一件事。未来做工具，不只要问一个问题：人会不会用？

还要多问一句：Agent 敢不敢把活交给你？

这个问题，可能会决定很多小 SaaS 的新机会。

至于具体怎么做，哪些环节值得做，哪些只是伪需求，哪些能收钱，哪些只适合开源引流，那是另外一个有所保留的话题了。但至少今天可以先把这句话放在这里。

别只给人做按钮。

也给 Agent 留一条路。