📄

Request My Resume

Thank you for your interest! To receive my resume, please reach out to me through any of the following channels:

AI Agent的工程化之路系列(一):AI Agent已死,“Micro Agent”永生?

AI Agent的工程化之路系列(一):AI Agent已死,“微型Agent”永生?

AI Agent的浪潮描绘了一个无比诱人的承诺:只需给AI一个目标,它就能像一个不知疲倦的超级实习生,自主规划、执行工具、完成一切。我们似乎终于可以扔掉那些繁琐的流程图和代码,进入一个“软件自生长”的全新纪元。

但如果你亲手构建过,或者深度使用过这类Agent,你会发现一个残酷的真相:当对话超过10-20轮,它们就会“迷失方向”,反复调用失败的工具,陷入无尽的循环。最终,这个被寄予厚望的“超级实习生”,变成了一个昂贵、不可靠、且令人沮丧的“数字宠物”。

问题出在哪?是模型不够聪明吗?并非如此。问题出在我们的架构范式上。这篇作为“AI工程化之路”系列的开篇,将继续由我的技术合伙人Tam带你回归软件的第一性原理,论证为何当前流行的“通用Agent”是一条歧路,而未来属于更小、更专注的“微型Agent”。

(本系列由果叔技术合伙人Tam主笔,由于他很内向不想露脸所以我替他发布)

第一章:软件的本质——一部由“图”谱写的历史

要理解Agent的未来,我们必须先回顾软件的过去。软件的本质是什么?从工程角度看,软件的执行过程,就是一个有向图(Directed Graph)。我们最早用流程图来表示它,清晰地定义了每一步操作和流转条件。

大约20年前,我们有了更强大的工具来管理这些图——以Airflow、Prefect为代表的DAG(有向无环图)工作流编排器。它们为这些流程带来了可观察性、模块化、重试机制等,让复杂的、确定性的软件系统变得可靠。

当机器学习模型出现时,我们只是将它作为图中的一个普通节点(Node)加入。比如,一个“文本摘要”或“情感分类”的ML模型节点,它接收输入,产出输出,整个系统依然是确定和可控的。

第二章:“通用Agent循环”的致命陷阱 🌀

“通用Agent”的承诺,正是要打破这个确定性的图。它试图让我们扔掉预设的流程,只给LLM一堆工具(图的“边”),让模型在运行时自己找出路径(图的“节点”)。这听起来很美好,但在实践中,我们很快就遇到了那个致命的陷阱——长上下文失效。

在当前流行的Agent Loop(如ReAct)模式中,每一次的工具调用和结果,都会被追加到上下文历史中。随着对话的进行,这个上下文会变得越来越长,充满了各种一次性的、与当前决策无关的“噪音”。最终,LLM的推理能力会急剧下降,就像在一个嘈杂的房间里无法听清指令一样,它会“迷失方向”,反复犯错。

一个你可能已经凭直觉感受到的残酷事实是:即使模型支持再长的上下文窗口,你总是能通过一个小的、专注的提示和上下文获得更好的结果。

一个在10%的情况下会崩溃的Agent,绝不能被交付给客户。因此,试图构建一个能解决所有问题的“通用Agent”,在当前技术下是不可行的。

第三章:新范式——作为“智能节点”的“微型Agent” ✨

真正有效的方法,不是抛弃我们经过数十年验证的、可靠的确定性工作流,而是将AI Agent“降级”,让它从一个试图掌控一切的“总指挥”,回归为一个负责特定任务的“智能节点”。这就是“微型Agent”(Micro Agents)的核心思想。

让我们以一个真实的deploybot(部署机器人)为例:

  1. 确定性代码 将PR合并到main分支后,自动部署到预发环境,并运行端到端测试。

  2. 微型Agent被激活,它的任务是:“将SHA 4af9ec0部署到生产环境”。

  3. Agent调用 deploy_frontend_to_prod 工具,但被确定性代码拦截,并向人类请求批准。

  4. 人类拒绝,并用自然语言回复:“能先部署后端吗?”

  5. 微型Agent的核心价值体现: 它接收并理解了这段模糊的人类指令,将其“翻译”成一个结构化的新指令,转而调用 deploy_backend_to_prod 工具。

  6. 后续的批准、执行、再部署前端,都由确定性代码主导,Agent只在需要时进行人机交互的“翻译”。

在这个模型中,LLM的强大能力被用在了刀刃上——处理非结构化的人类反馈。而整个系统的健壮性,则由我们熟悉的确定性代码来保障。

回归工程,而非迷信魔法

通往生产级AI应用的道路,并非寄望于一个无所不能的“魔法黑箱”。恰恰相反,它要求我们回归到经过数十年验证的、严谨的软件工程原则。

我们应该像构建微服务一样,将复杂的AI任务拆解。将我们的系统构建为健壮、可控、确定性的工作流,然后在需要“智能”的关键节点——尤其是需要处理模糊、非结构化输入的地方——策略性地嵌入“微型Agent”作为高效的翻译官和专家。

在这“AI Agent的工程化之路”系列的第一篇中,我们确立了“微型Agent”这一核心的架构思想。在接下来的文章中,我们将深入探讨实现这一思想的核心技术:如何夺回对提示、上下文和控制流的绝对所有权。敬请期待。

觉得果叔的分析有启发?点个「在看」,「转发」给更多需要的朋友吧!

关注我的公众号,与你一同探索 AI、出海与数字营销的无限可能。

Mr. Guo Logo

© 2026 Mr'Guo

Twitter Github WeChat