一个截图工具,突然让我重新理解 SaaS
我最近越来越觉得,CLI 这东西可能又要性感回来了。
这句话放在几年前,多少有点像工程师自嗨。黑窗口、命令、参数、报错,怎么听都不像一个“下一代 SaaS”的开头。过去几年我们聊 SaaS,聊得最多的是界面、转化、onboarding、dashboard、模板、协作和留存。用户进来以后,怎么让他少想一点,多点几下,最好第二天还能回来。
这个逻辑当然没错。人用软件,体验就是很重要。然而现在连我都天天离不开各种 CLI,已经是最好的证明。
但最近我看到 Apple Frames 4 的更新,突然觉得有些工具的用户可能已经不只是人了。Apple Frames 这个产品本来很具体,就是给苹果设备截图套官方风格的设备边框。设计师、写作者、开发者会用,但你很难说它是什么改变世界的大平台。
有意思的是,这次它不只是更新了 Shortcut,不只是加了多色设备边框和比例缩放,还发布了开源的 Apple Frames CLI。更关键的是,我去看了 MacStories 原文,确认这不是 Redol 摘要里的误读。原文明确说,Apple Frames CLI 是给 AI agents 使用的,并且带 Claude Code/Codex skill,可以让 coding agents 从 Mac 的任意文件夹里批量处理几十张甚至上百张截图。作者 Federico Viticci 还说,这个 CLI 本身就是他用 Claude Code 和 Codex 做出来的,并且已经能放进 Claude Code 测试 iOS app、截图、套框的同一条 agentic workflow 里。
一个截图加框工具,搞 CLI,搞 agent skill,还要让 Claude Code 和 Codex 能直接调用。
这件事小吗?小。
但它很有代表性。因为它说明软件工具正在开始认真服务一种新用户。这个用户不是坐在屏幕前点按钮的人,而是 Agent。不是宣传片里穿西装走来走去的“智能体”,也不是 PPT 里画得天花乱坠的平台概念。就是很具体的 Claude Code、Codex、Cursor、各种自动化脚本和工作流里的那个执行者。
它不会欣赏你的按钮漂不漂亮,不关心你的空状态页面有没有温度,也不会因为你用了一个很高级的渐变色,就觉得这个产品更值得付费。它关心的是这个工具能不能被调用,输入是不是稳定,输出是不是清楚,报错以后能不能判断哪里错了,有没有权限边界,能不能重复执行,失败以后能不能恢复,整个过程能不能留下记录。
说实话,如果这个趋势继续往前走,SaaS 的一部分价值判断会被重新洗一遍。
人用软件,和 Agent 用软件,不是一回事
以前我们做工具,默认是给人做。
给人做工具,核心是降低人的操作成本。界面要清楚,路径要短,按钮要好找,反馈要及时,审美不能太拉胯,最好还要有一点“我很懂你”的产品气质。用户从首页进来,注册,登录,看导航,点菜单,试功能,遇到问题再问客服。这个过程里,产品经理有很多发挥空间。你可以用交互引导,可以做模板,可以做案例,可以做可视化,也可以把复杂流程藏起来。
但 Agent 用你的工具,通常不是这样。
它可能是在一个长任务中间被调用。前面已经跑了几十步,后面还有几十步。它只需要把一张图处理好,把一批数据清洗好,把一个页面检测好,把一份 Markdown 转成 HTML,把一个报告生成 JSON,把一篇文章上传到草稿箱。它没有心情欣赏你,它只想知道一件事:这个任务交给你,能不能稳稳地回来。
这就是我觉得“给 Agent 做工具,可能比给人做工具更像下一代 SaaS”的原因。
这句话不是说以后不需要 UI 了。别误会。人类永远还是要配置目标、审批权限、验收结果、处理异常、掏钱续费。没有人类,软件商业就没了。至少目前还没到 AI 自己刷信用卡买 SaaS 的阶段,真到了那天,Stripe 估计也要先开个会。
我想说的是,SaaS 的一个新入口正在出现。过去 SaaS 争的是用户登录以后能不能留下来。以后有一类 SaaS 争的可能是,用户根本不用登录你,但他的 Agent 会不会一次又一次把任务交给你。
这个变化有点反直觉。
以前产品经理会焦虑 DAU、留存、页面停留时间、功能点击率。但在 Agent 工作流里,用户越喜欢你,可能越不想打开你。因为他希望你安静地把事办完。一个真正好用的基础设施,不需要你每天打开它,夸它今天界面真好看。你只希望它不掉链子。
这对做 SaaS 的人来说,挺残酷,也挺有机会。
残酷的地方在于,过去你靠界面占据用户注意力,以后用户可能直接绕过界面。机会在于,只要你能成为任务链里的可靠节点,用户不天天打开你,也可能天天依赖你。
你不一定占据注意力,但你占据任务链。
这两种价值不一样。注意力价值适合内容、社区、平台和消费级产品。任务链价值更适合工具、基础设施、垂直 SaaS 和自动化节点。很多普通创业者真正该想的,可能不是“我要不要做下一个 Notion”,而是“我能不能成为某类 Agent 工作流里最可靠的那一步”。
我自己的卡点:SERP API 又贵,又离不开
这件事我最近在自己规划每日网站博客文章自动更新任务时,感受特别明显。
如果只是让人做内容规划,人可以打开 Google,搜几个关键词,看几个页面,大概判断一下搜索意图、竞品标题、内容深度和页面类型。这个过程很慢,但人可以忍受。浏览器里有广告,有跳转,有地区差异,有各种乱七八糟的 SERP 组件,人靠经验还能凑合判断。
但一旦你想让 Agent 稳定做这件事,问题就完全不一样了。
Agent 不能只靠“我感觉 Google 结果差不多是这样”。它要稳定的 SERP 数据,要知道前十名页面是谁,标题是什么,摘要是什么,有没有广告,有没有 AI Overview,有没有 Reddit、YouTube、Shopping、People Also Ask 这些模块。它还要能反复跑,今天跑、明天跑、换关键词跑、换国家跑、换语言跑。
这时候最讨厌的东西来了:SERP API。
我最烦它,真的。为了得到稳定的 SERP 数据,又不得不用它。可是用了以后,又觉得价格实在太贵。1000 个搜索就要 25 美金。人手动查 20 个关键词,只是累一点;Agent 如果放开去跑,20 个主题,每个主题拆 5 个搜索变体,再做几轮验证,成本一下子就开始冒烟。
这就是一个非常典型的 Agent 工具问题。
从人的视角看,搜索引擎页面是免费的。你打开浏览器,输入关键词,看结果,顶多花时间。从 Agent 的视角看,稳定、可解析、可重复的 SERP 数据不是免费的,它是一种基础设施。你可以讨厌它贵,但只要你想让任务稳定跑,就会发现自己离不开它。
这个例子比很多宏大叙事都扎实。
因为它把问题说清楚了:Agent 时代的工具价值,很多时候不是“有没有一个漂亮后台”,而是“能不能把一个原本不稳定、不可控、靠人经验凑合的动作,变成稳定、可调用、可计费、可审计的能力”。
SERP API 为什么能收费?不是因为它界面好看。它收费,是因为它把混乱的搜索结果,变成 Agent 能吃的结构化数据。你觉得贵,说明成本真实存在;你又不得不用,说明价值也真实存在。
这就是下一代 SaaS 很可能出现的地方。
不是所有机会都长得像一个新平台。有些机会就长在这种很烦、很贵、很基础,但一旦自动化就绕不开的地方。
老东西重新排队:API、CLI、权限和日志
所以我不太愿意把“Agent 原生工具”讲得太玄。
这不是什么凭空冒出来的新魔法。Agent 时代很多所谓新东西,其实都是老东西重新排队。API 不是新东西,CLI 不是新东西,Webhook 不是新东西,自动化脚本不是新东西,插件生态也不是新东西。
新的是,过去这些东西主要服务工程师和高级用户,现在它们开始服务 AI。或者说,AI 让更多普通用户间接用上了这些原本偏工程化的能力。
以前一个非技术用户不会写脚本,就很难把十个工具串起来。现在他可以说一句“帮我把今天的网站博客选题规划出来,查 SERP,筛关键词,生成文章框架,再写进我的内容表”,Agent 就会尝试调用背后的一堆工具。
但它能不能调用成功,取决于这些工具有没有为“非人类调用者”留路。
一个 SaaS 只有网页按钮,没有 API,没有稳定导出,没有清楚的错误反馈,没有权限粒度,没有批处理能力,那么它对人来说也许很好用,但对 Agent 来说很难用。反过来,一个工具即使界面很朴素,只要能力足够清楚,接口足够稳定,输出足够干净,它就很容易被塞进各种 Agent 工作流里。
这也是 Apple Frames CLI 这个小例子让我在意的原因。
它不是因为“截图加框”这个动作多伟大,而是因为它把一个原本可以由人手动完成的动作,做成了 Agent 能调用的能力。截图在哪里,怎么识别设备尺寸,输出到哪里,怎样批量处理,怎样被 Claude Code/Codex 的 skill 理解,这些东西一旦清楚了,它就可以进入别人的工作流。
这才是重点。
给人做工具,你要让人觉得舒服。给 Agent 做工具,你要让系统觉得放心。舒服靠界面和体验,放心靠结构和边界。
这里面有很多过去看起来不性感的东西:稳定输入、结构化输出、退出码、错误码、日志、幂等、权限、审计、任务状态、可恢复流程。以前它们是在后台默默重要,前台负责卖相,后台负责兜底。到了 Agent 时代,它们可能会变成产品本身的一部分。
更准确地说,它们会变成产品能不能被 Agent 信任的理由。
普通开发者的机会,不在大而全
这就会带来一个很现实的创业问题:普通开发者还有没有机会?
我觉得有,但机会大概率不在“再做一个大而全的 AI SaaS”。这条路太重了。你要做账号系统,要做 billing,要做团队协作,要做权限,要做 dashboard,要做一堆模型接入,要做客服,还要和巨头卷渠道。最后产品看起来很完整,结果用户进来问一句:你和 ChatGPT Plus 有什么区别?
这个问题挺扎心的。
但如果换一个角度,机会会清楚很多。普通开发者可以做一块很窄、很稳、很好被 Agent 调用的小能力。不要一上来就想做“AI 内容平台”,可以先做一个能把 Markdown 稳定转成公众号 HTML 的工具。不要一上来就想做“AI SEO 全家桶”,可以先做一个能把页面抓取、标题描述检查、schema 检查、图片 alt 检查稳定吐成 JSON 的工具。不要一上来就想做“AI 电商运营平台”,可以先做一个能把商品图片处理、文件命名、alt 文案、Shopify 草稿创建稳定跑通的小工具。
这些东西单独拿出来,都不像一个巨大的 SaaS,甚至有点土。但它们都有一个共同点:它们是工作流里的可调用能力。
而可调用能力,在 Agent 时代可能会比一个漂亮后台更值钱。
过去很多 SaaS 的商业价值,来自于“把人留在我的系统里”。你登录我的后台,上传你的数据,在我的页面里协作,在我的 dashboard 里看结果,在我的生态里完成任务。这是一种很典型的平台思维。
但 Agent 工作流会反过来挑战这件事。用户可能不想进入你的系统,他只想把一个任务交给 Agent,然后 Agent 在背后调用十几个系统。你的产品只是其中一个节点。这听起来好像存在感变低了,但商业价值未必低。
因为当你成为某个关键节点以后,用户依赖的不是你的界面,而是你的能力稳定性。他不天天打开你,但他的流程天天调用你。
这也是为什么我觉得未来会出现一种很重要的形态,可以暂时叫 capability SaaS。
它不是卖一个完整系统,而是卖一个清楚、稳定、可调用、可计费的小能力。这个能力可以被人用,也可以被 Agent 用。人用的时候,它有一个简单界面;Agent 用的时候,它有 API、CLI、MCP server、schema、日志、权限和状态回调。人看到的是结果,Agent 看到的是接口,公司买单,买的是这个能力能不能长期嵌在自己的流程里。
这对独立开发者其实是好消息。
不是每个人都有资源做大平台,但很多人可以做一个窄能力。甚至越窄越好。宽了,你竞争不过大厂;窄了,你可以更懂场景,更懂失败点,更懂用户愿意为什么付钱。
跨境独立站的 AI 可读页面审计,公众号作者的 Markdown 到微信 HTML 稳定排版,Shopify 卖家的商品图处理和上架前检查,SEO 团队的 SERP 数据清洗和 AI 搜索引用监测,开发者的截图、录屏、发布说明、文档图片自动化处理,这些都不是“宇宙级平台”。但它们有一个共同特点:人不想反复做,Agent 又很适合做,中间就需要工具。
这就是机会。
但别把它吹成万能机会
当然,也别把这件事吹过头。
给 Agent 做工具,不等于你随便写个 API 就能赚钱。这里面有几个很现实的坑。
分发是第一关。Agent 能调用你,不代表用户知道你。你还是要解决获客。可能是 SEO,可能是开发者社区,可能是模板生态,可能是被主流 Agent 平台收录,也可能是靠开源工具切进去。标准是第二关。今天大家都在讲 MCP、tools、skills、API、workflow,但标准还在变。你做得太早,可能会踩接口变化;做得太晚,可能入口已经被别人占了。
信任是第三关。Agent 调用工具,其实是在把一部分执行权交出去。如果你的工具处理的是文件、账号、客户数据、发布权限、支付动作,用户会非常谨慎。计费是第四关。以前 SaaS 可以按 seat 收费,Agent 工具可能更适合按任务、调用量、处理量、结果质量、工作流节点收费。但这套账怎么让用户觉得合理,还需要摸。
还有可替代性。如果你的能力太简单,大模型自己就能做,或者用户用几行脚本就能替代,那就很难收钱。你必须在稳定性、场景理解、合规、集成、交付质量上有一点门槛。
所以这个方向不是“人人都能发财”。我最烦这种话。
它更像一个提醒:如果你现在想做 AI 工具,不要只盯着聊天界面和大而全平台。你可以回头看看那些被人嫌弃“不性感”的环节。文件处理、格式转换、发布前检查、截图生成、数据清洗、页面审计、权限控制、日志整理、报告输出,这些东西过去像边角料,但在 Agent 工作流里,边角料可能就是必经路口。
谁守住路口,谁就有机会收过路费。当然,这个“过路费”不能靠卡脖子收。真靠卡脖子,用户迟早绕过去。它要靠稳定、便宜、省心、可控。
这就是工具型 SaaS 的老逻辑。
AI 没有改变这个老逻辑。它只是让这个老逻辑重新变得显眼。
别只给人做按钮,也给 Agent 留一条路
所以回到标题。
为什么我说,给 Agent 做工具,可能比给人做工具更像下一代 SaaS?
因为当 Agent 成为执行者,SaaS 的价值会从“让人舒服地操作”扩展到“让任务可靠地完成”。当用户不再亲自点每一步,产品的可调用性、可恢复性、可审计性就会变成体验的一部分。当越来越多工作流由 Agent 串起来,一个小工具只要足够可靠,就可能成为很多流程里的固定节点。
这不是一个特别浪漫的未来,甚至有点朴素。下一代 SaaS 不一定每个都像科幻电影。很多可能就是一个稳定的接口,一个干净的 JSON,一个可靠的命令,一个权限边界很清楚的小工具。
但商业机会很多时候就是这样。
不是哪里最热闹,哪里就最有钱。有时候,真正有价值的地方,是别人觉得太小、太碎、太不性感,于是懒得认真做。等 Agent 真开始干活,这些小地方就会突然变成基础设施。
我现在越来越相信一件事。未来做工具,不只要问一个问题:人会不会用?
还要多问一句:Agent 敢不敢把活交给你?
这个问题,可能会决定很多小 SaaS 的新机会。
至于具体怎么做,哪些环节值得做,哪些只是伪需求,哪些能收钱,哪些只适合开源引流,那是另外一个有所保留的话题了。但至少今天可以先把这句话放在这里。
别只给人做按钮。
也给 Agent 留一条路。