AI-Agents

别再卷模型了：To B Agent 创业，用户反馈才是生死线

模型训练已成系统工程，单点突破不再构成壁垒——能替代初级岗位的 Agent 产品，靠场景数据和反馈闭环赢得市场

Posted on March 23, 2026 | 5 min | 920 words

2026 年，一个事实已经无法忽视：模型训练不再是一项研究活动，而是一项系统工程。

预训练需要万卡集群和 PB 级数据管线，强化学习需要奖励模型和 RLHF/DPO 的工程化流水线，推理优化涉及量化、蒸馏、speculative decoding 等一整套工具链，Agent 能力构建则横跨 function calling、长上下文、规划与工具使用的多维调优。任何一个方向的突破，如果不能在其他环节配合落地，就只是一篇论文，不是一个产品。

这意味着什么？模型本身正在变成标准化基础设施。 就像今天没有哪家 SaaS 公司拿"我们用了 PostgreSQL"当竞争优势一样，未来也不会有哪家 Agent 公司仅靠"我们微调了一个更好的模型"赢得市场。

那么 To B Agent 创业的制胜变量到底是什么？

当钉钉变成命令行：办公协同 Skill 的 Token 交付时代

钉钉 CLI 化开放让通用办公技能成为 AI Agent 的标准装备——过去靠定制软件解决的个性化需求，现在用 Token 就能交付

Posted on March 22, 2026 | 2 min | 385 words

软件行业有一个永恒的矛盾：标准化产品满足不了个性化需求，定制开发又贵得离谱。每家企业都想要"适合自己的办公系统"，但 SaaS 只能给你 80% 的功能，剩下 20% 要么忍着，要么花十倍的钱去定制。

钉钉的 CLI 化开放正在改变这个游戏规则。当钉钉的消息、日历、审批、文档、通讯录等能力都可以通过命令行接口被 AI Agent 直接调用时，一个新范式浮现了：过去需要写代码、做定制、走项目的办公需求，现在可以用自然语言描述，由 AI 用 Token 来交付。

人写规则，Token做实验：从Karpathy的autoresearch看AI应用优化新范式

把人从试错循环中解放出来，用Token一夜跑完500轮实验

Posted on March 21, 2026 | 3 min | 531 words

Karpathy 在 2026 年 3 月开源了 autoresearch，两周内收获近 5 万 Star。项目本身很简单——让 AI Agent 自动修改 LLM 训练代码、跑实验、看指标、保留好的、丢弃差的，一夜循环 100 轮。但简单的背后藏着一个深刻的范式转移：在 AI 时代，人的角色从"做实验的人"变成了"设计实验规则的人"，而试错循环本身，交给 Token 去完成。

这不只是 AI 研究的事。任何可以量化评估、快速迭代的业务场景，都可以套用这个范式。

自我进化的AI助手：OpenClaw如何用Heartbeat实现Skill自动优化

从autoresearch到Agent自闭环优化——执行产生数据，数据驱动优化，优化改善执行

Posted on March 21, 2026 | 6 min | 1140 words

在上一篇文章中，我从 Karpathy 的 autoresearch 项目提炼了一个范式：人写规则，Token 做实验。我们用 AI 客服 Prompt 优化作为案例，验证了这个范式在业务场景中的可行性。但那个方案有一个前提——你需要预先准备评估数据集。

OpenClaw 的场景让我意识到，还有一种更彻底的可能：Agent 用自己的真实执行数据作为评估信号，在用户无感知的情况下持续自我优化。 不需要人工标注测试集，不需要离线批处理，每一次真实使用都是一条训练数据。

悟空是AI时代的淘宝：Token消费的多快好省

Agent工程的终极目标，是对模型Token消耗的多快好省优化

Posted on March 20, 2026 | 3 min | 633 words

1962年，一位伟人为中国工业发展题写了"鼓足干劲，力争上游，多快好省地建设社会主义"。六十多年后，当我们审视AI Agent工程的核心挑战时，会发现一个惊人的对称：Agent工程的终极优化目标，本质上就是对模型Token消耗的"多快好省"。

淘宝用十五年把"多快好省"刻进了中国零售的DNA——商品要多、物流要快、品质要好、价格要省。而今天的AI Agent Runtime，正在用同一套逻辑重塑Token消费——模型类型要多、响应速度要快、完成效果要好、使用成本要省。

悟空——孙悟空七十二变（多）、筋斗云十万八千里（快）、金箍棒降妖除魔（好）、一根毫毛变千猴（省）。一个优秀的Agent Runtime，就是AI时代的淘宝，Token世界的悟空。

AI Native 文档：会话即知识，过程即资产

传统文档记录结论，AI Native 文档记录思考

Posted on March 16, 2026 | 2 min | 316 words

企业每天都在产生大量知识，但绝大多数知识从未被记录下来。不是因为没有文档系统，而是因为真正的知识不在文档里，而在产生文档的过程中。

一份产品方案的最终版本只有 10 页，但写这 10 页的过程中，团队讨论了 20 个方案、否定了 15 个、在 3 个关键决策点上反复权衡。这些讨论、推理和决策——才是企业最有价值的知识。传统文档系统只保存了结论，丢掉了思考。

AI Native 文档要解决的，就是这个问题。

构建企业级Agent Runtime：从Skill到Workspace的五层架构

Agent 负责规划，Sub-Agent 负责执行，Skill 负责方法，MCP 负责连接，Workspace 负责上下文

Posted on March 16, 2026 | 3 min | 624 words

很多团队对 Agent 的理解还停留在"LLM + Prompt + 几个工具调用"。这种理解能跑通 Demo，但一旦进入企业级场景——多任务并行、多系统集成、多角色协作、安全审计——就会发现：Agent 系统的核心挑战不是让 LLM 更聪明，而是构建一个可扩展、可治理、可审计的运行时架构。

Agent 系统本质上在解决五个问题：用户要做什么（Agent）、谁来执行（Sub-Agent）、如何执行（Skill）、从哪里获取数据（MCP）、执行过程的状态存在哪里（Workspace）。这五个问题对应了系统的五个核心层次。

本文将这套架构完整展开。

AI Agent 架构的终局，是 Unix 哲学的回归

Skill CLI = Unix Command，Agent Workspace = Unix Filesystem——我们正在重新发明 Unix

Posted on March 15, 2026 | 3 min | 628 words

最近在梳理各种 AI Agent 框架和 Runtime 的架构时，我产生了一个越来越强烈的感觉：我们正在重新发明 Unix。

不是比喻。是字面意义上的重新发明。当你把今天主流的 Agent 架构摊开来看——Skill、Workspace、Tool、Pipeline、Orchestrator——你会发现，这些概念和 50 年前 Unix 的设计哲学几乎一一对应。区别只是换了一层 AI 的皮。

为 AI 重建的 IM 架构

从传递消息到管理意图——当 Agent 成为 IM 的一等公民，通信协议需要被重新设计

Posted on March 15, 2026 | 5 min | 931 words

传统 IM（即时通讯）解决的是一个简单的问题：让人和人高效地交换信息。文本、图片、文件、语音——三十年来，IM 的核心架构围绕着"谁说了什么"展开，安全靠端到端加密，权限靠静态角色控制，审计靠消息日志。这套体系服务了几十亿用户，足够成熟。

但当 AI Agent 成为 IM 中的活跃参与者——不仅接收消息，还理解意图、调用工具、执行任务、产生后果——传统 IM 的架构假设就被从根本上打破了。IM 不再只是信息传递的通道，而是 Agent 协作与执行的操作系统。

这需要一种全新的 IM 架构。

企业级 Agent Runtime 的第一道防线：安全沙箱

文件系统隔离 + 网络访问隔离——从 macOS Seatbelt 到 Windows AppContainer 的操作系统级安全实践

Posted on March 15, 2026 | 6 min | 1159 words

当我们谈论企业级 AI Agent Runtime 时，第一个需要解决的问题不是"模型有多聪明"，而是"Agent 执行的代码有多安全"。一个能读写文件、执行命令、访问网络的 Agent，如果没有安全边界，就是一颗不知道什么时候会爆炸的定时炸弹。

企业级的 Agent Runtime 首先需要一个安全沙箱：文件系统隔离 + 网络访问隔离。