为 Agent 设计极限挑战任务:AI 时代 Agent 架构师的新价值

Designing Extreme Challenge Tasks for Agents: The New Value of AI Architects

当 AI Agent 能够自主编写代码、调用工具、完成任务时,架构师的价值在哪里?

答案可能出乎意料: 架构师的核心竞争力,正在从「设计系统」转向「设计挑战」

在 AI 时代,最有价值的架构师不是那个能写出最复杂 Prompt 的人,而是那个能设计出最刁钻测试用例、最极端边界场景、最能暴露系统脆弱性的「极限挑战设计师」。

这就像 SRE 领域的混沌工程(Chaos Engineering)——最有价值的不是搭建一个完美的系统,而是设计出一套能持续发现系统弱点的实验。

[Read More]

AI 时代,校招生如何成为好架构师

The AI-Native Architect: A Growth Path for Fresh Graduates

上周一个计算机大四学生加我钉钉问:“朱老师,我们宿舍最近吵翻了。一个室友说现在 Cursor 能秒写算法题,刷 LeetCode 是浪费时间,应该去学系统设计;另一个说大厂面试还在考八股,老老实实刷题才靠谱。我已经拿了 offer,再过 4 个月入职——我现在应该学什么?”

这个问题很典型。它背后其实藏着一个更深的认知误区——把"写代码"和"做架构"看作两个独立的阶段,仿佛 AI 替代了前者,后者就可以直接上手。

但真相恰恰相反。AI 不是让你跳过写代码,而是让你在写代码的过程中,同时训练架构思维。 传统的架构师成长路径是"先写 5 年代码,再学系统设计",而 AI 时代的路径是"从你写第一行代码起,就让 AI 帮你同时跑两条线"。

这篇博客就是写给正在毕业、或者刚入职 1-2 年的计算机专业同学的。我会给你一个可以从 今天 就开始执行的成长路径。

[Read More]

Agent 如何同时活在钉钉、Telegram、Discord 和微信里?

How Hermes Agent Gateway Unifies 18 IM Platforms with a Single Codebase

上周团队在规划 Agent 的多渠道接入方案。有人说"每个 IM 写一套 adapter",有人说"统一用 Webhook 接收然后标准化"。

我打开 Hermes Agent 的代码仓库,gateway/platforms/ 目录下躺着 18 个平台适配器——从 Telegram、Discord 到钉钉、飞书、企业微信、QQ 机器人,甚至还有 iMessage(BlueBubbles)、Signal 和 Home Assistant。

“所有平台共享同一个 Agent Loop,同一套 Session 管理,同一套工具调用。”

他们问:“那 18 个 adapter 之间代码复用率有多少?”

我给他们看了一张图。

[Read More]

解构 Agent CLI:从 React 子进程到 Python 回调的通信协议

How Hermes Agent TUI and CLI Communicate with the Agent Loop — Architecture Deep Dive

上周团队在讨论 Agent 产品的交互方案。前端同学主张用 Web UI + WebSocket,理由是现代、可扩展、支持多端。后端同学说那不如直接嵌到现有产品里,用 HTTP REST API。

我打开了我们自己的 Agent 代码仓库,给他们看了两套实现——一套是纯 Python 的同进程架构,另一套是 React + Python 子进程通过 JSON-RPC 通信。

“我们同一个产品里,两套通信协议并存。”

他们沉默了几秒。“为什么?”

因为这不是架构设计的失误,而是交互范式的必然分化。CLI 要的是零延迟的本地体验,TUI 要的是跨进程的事件驱动架构。用一套协议去套两种场景,只会两头都不讨好。

今天我们就来解剖一下 Hermes Agent 的两种交互架构——看看 CLI 和 TUI 分别是怎么和 Agent Loop 通信的,协议是什么,为什么这么设计。

[Read More]

同一个生意做了四遍:从搜索到Agent,万物皆排序

搜索、广告、推荐、Agent——四代系统的底层逻辑和商业本质,从未改变

如果你在过去二十年里分别做过搜索引擎、广告系统、推荐系统,再到今天做AI Agent,你可能会有一个越来越强烈的感觉:这不就是同一个生意吗?

表面上看,Google做搜索、Meta做广告、抖音做推荐、OpenAI做Agent,四个完全不同的产品形态,四个不同的技术栈,甚至四个不同的行业叙事。但如果你把外壳剥掉,盯着底层看,会发现一个令人不安的事实:这四代系统的核心逻辑,从来没有变过。

它们都在做同一件事——在信息过载的世界里,帮用户匹配到最相关的东西,然后从匹配效率的提升中抽税。

[Read More]

Agent的架构之战:从Desktop到AI时代,架构决定平台的生死

架构不是技术选型,是产品能走多远、用户体验能做多好的根本约束

每一代平台级产品的竞争,最终都不是功能之争,而是架构之争。Windows赢了OS/2,不是因为功能更多,而是因为它的架构让第三方开发者能更容易地构建应用。iOS赢了Symbian,不是因为初期功能更强,而是因为它的架构从第一天就为触控交互和应用生态设计。Chrome赢了IE,不是因为它一开始更快,而是因为多进程架构让它在页面崩溃时不会拖垮整个浏览器。

现在,AI Agent正在成为从Desktop、Web、Mobile之后的第四代平台级产品。而历史正在重演:决定谁能赢的,不是谁的模型更强、谁的功能更多,而是谁的架构更对。

[Read More]

AI的MaaS层最核心的能力:把一个不稳定的概率接口,变成一个可运营的服务

Model as a Service不是套壳API,而是AI应用从Demo到生产的关键基础设施

很多人对MaaS(Model as a Service)的理解停留在"套一层API"——把OpenAI的接口包一下,加个Key管理,做个用量统计,就叫MaaS了。如果这就是MaaS的全部,那它确实没什么技术含量,随便一个API Gateway就能干。

但现实是:几乎所有在生产环境跑AI应用的团队,最终都会自建或依赖一个MaaS层。 不是因为他们闲,而是因为裸调模型API在生产环境里根本撑不住。

MaaS层真正要解决的问题是:把一个概率性的、无状态的、昂贵的模型API调用,变成一个可靠的、可观测的、成本可控的服务。

[Read More]

OpenClaw + Claude Code 协同:用 Sub-Agent 执行编程任务并实时同步进度

从 stream-json 到钉钉通知,打通 AI 编程任务的全链路可观测性

你在钉钉里对 AI 助手说:“帮我写一个博客文章”,然后 Agent 回复"好的"——接下来呢?你等了 3 分钟、5 分钟、10 分钟,不知道它在干什么、进展到哪了、是不是卡住了。这是所有 Agent 系统面临的共同问题:编程类耗时任务的进度黑洞

OpenClaw 通过 Sub-Agent 机制调用 Claude Code 执行编程任务,再借助 stream-json 输出格式和一个轻量级的监控脚本,将任务进度实时同步到钉钉。本文完整拆解这套方案的架构设计和实现细节。

[Read More]

自我进化的AI助手:OpenClaw如何用Heartbeat实现Skill自动优化

从autoresearch到Agent自闭环优化——执行产生数据,数据驱动优化,优化改善执行

上一篇文章中,我从 Karpathy 的 autoresearch 项目提炼了一个范式:人写规则,Token 做实验。我们用 AI 客服 Prompt 优化作为案例,验证了这个范式在业务场景中的可行性。但那个方案有一个前提——你需要预先准备评估数据集。

OpenClaw 的场景让我意识到,还有一种更彻底的可能:Agent 用自己的真实执行数据作为评估信号,在用户无感知的情况下持续自我优化。 不需要人工标注测试集,不需要离线批处理,每一次真实使用都是一条训练数据。

[Read More]

悟空是AI时代的淘宝:Token消费的多快好省

Agent工程的终极目标,是对模型Token消耗的多快好省优化

1962年,一位伟人为中国工业发展题写了"鼓足干劲,力争上游,多快好省地建设社会主义"。六十多年后,当我们审视AI Agent工程的核心挑战时,会发现一个惊人的对称:Agent工程的终极优化目标,本质上就是对模型Token消耗的"多快好省"。

淘宝用十五年把"多快好省"刻进了中国零售的DNA——商品要多、物流要快、品质要好、价格要省。而今天的AI Agent Runtime,正在用同一套逻辑重塑Token消费——模型类型要、响应速度要、完成效果要、使用成本要

悟空——孙悟空七十二变(多)、筋斗云十万八千里(快)、金箍棒降妖除魔(好)、一根毫毛变千猴(省)。一个优秀的Agent Runtime,就是AI时代的淘宝,Token世界的悟空。

[Read More]