Architecture

我打开 Hermes Agent 的代码仓库，gateway/platforms/ 目录下躺着 18 个平台适配器——从 Telegram、Discord 到钉钉、飞书、企业微信、QQ 机器人，甚至还有 iMessage（BlueBubbles）、Signal 和 Home Assistant。

“所有平台共享同一个 Agent Loop，同一套 Session 管理，同一套工具调用。”

他们问：“那 18 个 adapter 之间代码复用率有多少？”

我给他们看了一张图。

解构 Agent CLI：从 React 子进程到 Python 回调的通信协议

How Hermes Agent TUI and CLI Communicate with the Agent Loop — Architecture Deep Dive

Posted on April 19, 2026 | 7 min | 1329 words

上周团队在讨论 Agent 产品的交互方案。前端同学主张用 Web UI + WebSocket，理由是现代、可扩展、支持多端。后端同学说那不如直接嵌到现有产品里，用 HTTP REST API。

我打开了我们自己的 Agent 代码仓库，给他们看了两套实现——一套是纯 Python 的同进程架构，另一套是 React + Python 子进程通过 JSON-RPC 通信。

“我们同一个产品里，两套通信协议并存。”

他们沉默了几秒。“为什么？”

因为这不是架构设计的失误，而是交互范式的必然分化。CLI 要的是零延迟的本地体验，TUI 要的是跨进程的事件驱动架构。用一套协议去套两种场景，只会两头都不讨好。

今天我们就来解剖一下 Hermes Agent 的两种交互架构——看看 CLI 和 TUI 分别是怎么和 Agent Loop 通信的，协议是什么，为什么这么设计。

同一个生意做了四遍：从搜索到Agent，万物皆排序

搜索、广告、推荐、Agent——四代系统的底层逻辑和商业本质，从未改变

Posted on March 30, 2026 | 2 min | 378 words

如果你在过去二十年里分别做过搜索引擎、广告系统、推荐系统，再到今天做AI Agent，你可能会有一个越来越强烈的感觉：这不就是同一个生意吗？

表面上看，Google做搜索、Meta做广告、抖音做推荐、OpenAI做Agent，四个完全不同的产品形态，四个不同的技术栈，甚至四个不同的行业叙事。但如果你把外壳剥掉，盯着底层看，会发现一个令人不安的事实：这四代系统的核心逻辑，从来没有变过。

它们都在做同一件事——在信息过载的世界里，帮用户匹配到最相关的东西，然后从匹配效率的提升中抽税。

Agent的架构之战：从Desktop到AI时代，架构决定平台的生死

架构不是技术选型，是产品能走多远、用户体验能做多好的根本约束

Posted on March 29, 2026 | 2 min | 400 words

每一代平台级产品的竞争，最终都不是功能之争，而是架构之争。Windows赢了OS/2，不是因为功能更多，而是因为它的架构让第三方开发者能更容易地构建应用。iOS赢了Symbian，不是因为初期功能更强，而是因为它的架构从第一天就为触控交互和应用生态设计。Chrome赢了IE，不是因为它一开始更快，而是因为多进程架构让它在页面崩溃时不会拖垮整个浏览器。

现在，AI Agent正在成为从Desktop、Web、Mobile之后的第四代平台级产品。而历史正在重演：决定谁能赢的，不是谁的模型更强、谁的功能更多，而是谁的架构更对。

[Read More]

AI Agent architecture platform 思考

AI的MaaS层最核心的能力：把一个不稳定的概率接口，变成一个可运营的服务

Model as a Service不是套壳API，而是AI应用从Demo到生产的关键基础设施

Posted on March 28, 2026 | 2 min | 345 words

很多人对MaaS（Model as a Service）的理解停留在"套一层API"——把OpenAI的接口包一下，加个Key管理，做个用量统计，就叫MaaS了。如果这就是MaaS的全部，那它确实没什么技术含量，随便一个API Gateway就能干。

但现实是：几乎所有在生产环境跑AI应用的团队，最终都会自建或依赖一个MaaS层。 不是因为他们闲，而是因为裸调模型API在生产环境里根本撑不住。

MaaS层真正要解决的问题是：把一个概率性的、无状态的、昂贵的模型API调用，变成一个可靠的、可观测的、成本可控的服务。

[Read More]

AI MaaS architecture LLM infrastructure

OpenClaw + Claude Code 协同：用 Sub-Agent 执行编程任务并实时同步进度

从 stream-json 到钉钉通知，打通 AI 编程任务的全链路可观测性

Posted on March 28, 2026 | 8 min | 1569 words

你在钉钉里对 AI 助手说：“帮我写一个博客文章”，然后 Agent 回复"好的"——接下来呢？你等了 3 分钟、5 分钟、10 分钟，不知道它在干什么、进展到哪了、是不是卡住了。这是所有 Agent 系统面临的共同问题：编程类耗时任务的进度黑洞。

OpenClaw 通过 Sub-Agent 机制调用 Claude Code 执行编程任务，再借助 stream-json 输出格式和一个轻量级的监控脚本，将任务进度实时同步到钉钉。本文完整拆解这套方案的架构设计和实现细节。

自我进化的AI助手：OpenClaw如何用Heartbeat实现Skill自动优化

从autoresearch到Agent自闭环优化——执行产生数据，数据驱动优化，优化改善执行

Posted on March 21, 2026 | 6 min | 1140 words

在上一篇文章中，我从 Karpathy 的 autoresearch 项目提炼了一个范式：人写规则，Token 做实验。我们用 AI 客服 Prompt 优化作为案例，验证了这个范式在业务场景中的可行性。但那个方案有一个前提——你需要预先准备评估数据集。

OpenClaw 的场景让我意识到，还有一种更彻底的可能：Agent 用自己的真实执行数据作为评估信号，在用户无感知的情况下持续自我优化。 不需要人工标注测试集，不需要离线批处理，每一次真实使用都是一条训练数据。

悟空是AI时代的淘宝：Token消费的多快好省

Agent工程的终极目标，是对模型Token消耗的多快好省优化

Posted on March 20, 2026 | 3 min | 633 words

1962年，一位伟人为中国工业发展题写了"鼓足干劲，力争上游，多快好省地建设社会主义"。六十多年后，当我们审视AI Agent工程的核心挑战时，会发现一个惊人的对称：Agent工程的终极优化目标，本质上就是对模型Token消耗的"多快好省"。

淘宝用十五年把"多快好省"刻进了中国零售的DNA——商品要多、物流要快、品质要好、价格要省。而今天的AI Agent Runtime，正在用同一套逻辑重塑Token消费——模型类型要多、响应速度要快、完成效果要好、使用成本要省。

悟空——孙悟空七十二变（多）、筋斗云十万八千里（快）、金箍棒降妖除魔（好）、一根毫毛变千猴（省）。一个优秀的Agent Runtime，就是AI时代的淘宝，Token世界的悟空。