当 AI Agent 能够自主编写代码、调用工具、完成任务时,架构师的价值在哪里?
答案可能出乎意料: 架构师的核心竞争力,正在从「设计系统」转向「设计挑战」。
在 AI 时代,最有价值的架构师不是那个能写出最复杂 Prompt 的人,而是那个能设计出最刁钻测试用例、最极端边界场景、最能暴露系统脆弱性的「极限挑战设计师」。
这就像 SRE 领域的混沌工程(Chaos Engineering)——最有价值的不是搭建一个完美的系统,而是设计出一套能持续发现系统弱点的实验。
[Read More]当 AI Agent 能够自主编写代码、调用工具、完成任务时,架构师的价值在哪里?
答案可能出乎意料: 架构师的核心竞争力,正在从「设计系统」转向「设计挑战」。
在 AI 时代,最有价值的架构师不是那个能写出最复杂 Prompt 的人,而是那个能设计出最刁钻测试用例、最极端边界场景、最能暴露系统脆弱性的「极限挑战设计师」。
这就像 SRE 领域的混沌工程(Chaos Engineering)——最有价值的不是搭建一个完美的系统,而是设计出一套能持续发现系统弱点的实验。
[Read More]上周一个计算机大四学生加我钉钉问:“朱老师,我们宿舍最近吵翻了。一个室友说现在 Cursor 能秒写算法题,刷 LeetCode 是浪费时间,应该去学系统设计;另一个说大厂面试还在考八股,老老实实刷题才靠谱。我已经拿了 offer,再过 4 个月入职——我现在应该学什么?”
这个问题很典型。它背后其实藏着一个更深的认知误区——把"写代码"和"做架构"看作两个独立的阶段,仿佛 AI 替代了前者,后者就可以直接上手。
但真相恰恰相反。AI 不是让你跳过写代码,而是让你在写代码的过程中,同时训练架构思维。 传统的架构师成长路径是"先写 5 年代码,再学系统设计",而 AI 时代的路径是"从你写第一行代码起,就让 AI 帮你同时跑两条线"。
这篇博客就是写给正在毕业、或者刚入职 1-2 年的计算机专业同学的。我会给你一个可以从 今天 就开始执行的成长路径。
[Read More]上周团队在规划 Agent 的多渠道接入方案。有人说"每个 IM 写一套 adapter",有人说"统一用 Webhook 接收然后标准化"。
我打开 Hermes Agent 的代码仓库,gateway/platforms/ 目录下躺着 18 个平台适配器——从 Telegram、Discord 到钉钉、飞书、企业微信、QQ 机器人,甚至还有 iMessage(BlueBubbles)、Signal 和 Home Assistant。
“所有平台共享同一个 Agent Loop,同一套 Session 管理,同一套工具调用。”
他们问:“那 18 个 adapter 之间代码复用率有多少?”
我给他们看了一张图。
[Read More]上周团队在讨论 Agent 产品的交互方案。前端同学主张用 Web UI + WebSocket,理由是现代、可扩展、支持多端。后端同学说那不如直接嵌到现有产品里,用 HTTP REST API。
我打开了我们自己的 Agent 代码仓库,给他们看了两套实现——一套是纯 Python 的同进程架构,另一套是 React + Python 子进程通过 JSON-RPC 通信。
“我们同一个产品里,两套通信协议并存。”
他们沉默了几秒。“为什么?”
因为这不是架构设计的失误,而是交互范式的必然分化。CLI 要的是零延迟的本地体验,TUI 要的是跨进程的事件驱动架构。用一套协议去套两种场景,只会两头都不讨好。
今天我们就来解剖一下 Hermes Agent 的两种交互架构——看看 CLI 和 TUI 分别是怎么和 Agent Loop 通信的,协议是什么,为什么这么设计。
[Read More]如果你在过去二十年里分别做过搜索引擎、广告系统、推荐系统,再到今天做AI Agent,你可能会有一个越来越强烈的感觉:这不就是同一个生意吗?
表面上看,Google做搜索、Meta做广告、抖音做推荐、OpenAI做Agent,四个完全不同的产品形态,四个不同的技术栈,甚至四个不同的行业叙事。但如果你把外壳剥掉,盯着底层看,会发现一个令人不安的事实:这四代系统的核心逻辑,从来没有变过。
它们都在做同一件事——在信息过载的世界里,帮用户匹配到最相关的东西,然后从匹配效率的提升中抽税。
[Read More]每一代平台级产品的竞争,最终都不是功能之争,而是架构之争。Windows赢了OS/2,不是因为功能更多,而是因为它的架构让第三方开发者能更容易地构建应用。iOS赢了Symbian,不是因为初期功能更强,而是因为它的架构从第一天就为触控交互和应用生态设计。Chrome赢了IE,不是因为它一开始更快,而是因为多进程架构让它在页面崩溃时不会拖垮整个浏览器。
现在,AI Agent正在成为从Desktop、Web、Mobile之后的第四代平台级产品。而历史正在重演:决定谁能赢的,不是谁的模型更强、谁的功能更多,而是谁的架构更对。
[Read More]很多人对MaaS(Model as a Service)的理解停留在"套一层API"——把OpenAI的接口包一下,加个Key管理,做个用量统计,就叫MaaS了。如果这就是MaaS的全部,那它确实没什么技术含量,随便一个API Gateway就能干。
但现实是:几乎所有在生产环境跑AI应用的团队,最终都会自建或依赖一个MaaS层。 不是因为他们闲,而是因为裸调模型API在生产环境里根本撑不住。
MaaS层真正要解决的问题是:把一个概率性的、无状态的、昂贵的模型API调用,变成一个可靠的、可观测的、成本可控的服务。
[Read More]你在钉钉里对 AI 助手说:“帮我写一个博客文章”,然后 Agent 回复"好的"——接下来呢?你等了 3 分钟、5 分钟、10 分钟,不知道它在干什么、进展到哪了、是不是卡住了。这是所有 Agent 系统面临的共同问题:编程类耗时任务的进度黑洞。
OpenClaw 通过 Sub-Agent 机制调用 Claude Code 执行编程任务,再借助 stream-json 输出格式和一个轻量级的监控脚本,将任务进度实时同步到钉钉。本文完整拆解这套方案的架构设计和实现细节。
在上一篇文章中,我从 Karpathy 的 autoresearch 项目提炼了一个范式:人写规则,Token 做实验。我们用 AI 客服 Prompt 优化作为案例,验证了这个范式在业务场景中的可行性。但那个方案有一个前提——你需要预先准备评估数据集。
OpenClaw 的场景让我意识到,还有一种更彻底的可能:Agent 用自己的真实执行数据作为评估信号,在用户无感知的情况下持续自我优化。 不需要人工标注测试集,不需要离线批处理,每一次真实使用都是一条训练数据。
[Read More]1962年,一位伟人为中国工业发展题写了"鼓足干劲,力争上游,多快好省地建设社会主义"。六十多年后,当我们审视AI Agent工程的核心挑战时,会发现一个惊人的对称:Agent工程的终极优化目标,本质上就是对模型Token消耗的"多快好省"。
淘宝用十五年把"多快好省"刻进了中国零售的DNA——商品要多、物流要快、品质要好、价格要省。而今天的AI Agent Runtime,正在用同一套逻辑重塑Token消费——模型类型要多、响应速度要快、完成效果要好、使用成本要省。
悟空——孙悟空七十二变(多)、筋斗云十万八千里(快)、金箍棒降妖除魔(好)、一根毫毛变千猴(省)。一个优秀的Agent Runtime,就是AI时代的淘宝,Token世界的悟空。
[Read More]