Workspace + Git + Agent:AI 时代的工作操作系统

Everything is file——当所有 AI 工件都是文件,Workspace 的结构设计就是你的竞争力

过去一年,我越来越确信一个判断:AI 时代真正的工作操作系统,不是某个 App,不是某个平台,而是 Workspace + Git + Agent 这个三位一体的组合。

为什么?因为 AI Agent 的一切——输入、输出、系统提示词、上下文、执行过程、临时生成的代码、图片、文档,甚至应用程序本身——本质上都是文件。既然 everything is file,那么管理这些文件的方式,就决定了你驾驭 AI 的效率和上限。

[Read More]

让 Agent 更准确地完成任务,关键不在模型,而在环境

干净环境、充足上下文、探索空间、工具能力——Agent 质量的四根支柱

做了一年多 AI Agent 开发,我逐渐形成了一个核心观点:让 Agent 更准确更高质量地完成任务,最关键的不是换一个更强的模型,而是给它一个正确的执行环境。

具体来说,这个"正确的执行环境"包含四个要素:干净的执行环境、充足且正确的上下文、允许自我探索的空间、以及学会使用工具解决问题的能力。

[Read More]

以前人给 AI 造工具,现在 AI 自己造工具

从声明式工具调用到程序化工具调用(PTC),AI Agent 的工具范式正在发生根本性转变

做 AI Agent 开发这一年多来,我经历了一个认知上的转变:以前的默认思路是"我要给 AI 准备好一切工具,让它去调用";而现在,越来越多的场景让我意识到——AI 为了完成任务,会自己造工具。这不是一个隐喻,而是一个正在发生的技术事实。

[Read More]

大模型 Tool Use 准确率可达 99%,但前提是工具足够简单

为什么平台服务 Tools 化的最佳实践是写 CLI

最近在做 Agent 开发时,我发现一个有意思的现象:大模型调用工具的准确率其实可以非常高,达到 99% 甚至更高——但这有一个关键前提:工具本身要足够简单。这也解释了一个行业趋势:越来越多的平台服务在做 Tools 化时,选择的路径是写 CLI,而不是暴露复杂的 SDK 或 REST API。

[Read More]

Agent 设计最佳实践:Memory

从每日日志到向量检索,深入解析 OpenClaw 如何让 AI 真正「记住」你

想象这样一个场景:你花了半小时向 AI 助手解释你的项目架构、编码偏好和团队规范,得到了一次满意的协作体验。第二天再打开对话——它全忘了。你又得从头来一遍。这不是 AI 不够聪明的问题,而是记忆架构缺失的问题。OpenClaw 的 Memory 系统试图从根本上解决这个痛点:让 AI Agent 拥有持久、可检索、可自维护的记忆能力。

[Read More]

Agent 设计最佳实践:OpenClaw 的 Heartbeat 设计

让 AI 助手主动做事的心跳机制——从被动应答到主动巡检

绝大多数 AI 助手都是被动的——用户不说话,它就沉默。这在"问答"场景下没问题,但如果你想让 AI 助手真正成为助手,它需要主动意识:定期检查收件箱有没有紧急邮件、日历上有没有即将到来的会议、GitHub 上有没有需要关注的 PR。OpenClaw 的 Heartbeat(心跳)机制正是为此设计的。本文将深入解析这一设计的工程细节和最佳实践。

[Read More]

OpenClaw 架构解析:如何构建一个有记忆、有灵魂的个人 AI 助手

从文件即记忆到多 Agent 协作,深入理解 OpenClaw 的设计哲学

大多数 AI 助手是无状态的——你关掉窗口,它就忘了你是谁。OpenClaw 试图解决一个更本质的问题:能不能让 AI 助手像一个真正的助手一样,记住你、理解你、主动帮你? 经过几周的实际使用,我想分享一下 OpenClaw 的架构设计和背后的思考。

[Read More]

Manus、Lovable、Dify、Coze 的本质:为大模型开发 Skills 的工具

当 AI 平台的护城河不再是技术本身,而是生态、用户规模和沉淀下来的数据

2025 年以来,AI 应用层出现了一波令人眼花缭乱的平台:Manus 主打通用 AI Agent,Lovable 专注 AI 驱动的应用生成,Dify 提供 LLM 应用编排框架,Coze(扣子)让用户可以可视化地构建 AI Bot。它们看起来各有侧重,产品形态也不尽相同,但如果你退后一步观察,会发现它们在做的事情本质上是一样的——为大模型开发 Skills

[Read More]

如何对会议纪要 Agent 进行 Benchmark?完整指南与实践

从评估指标设计到自动化测试的全流程实战

在 AI Agent 应用日益普及的今天,会议纪要生成是最常见的落地场景之一。然而,如何科学地评估一个会议纪要 Agent 的性能,却是许多开发者面临的难题。本文将详细介绍如何构建一个完整的 benchmark 体系,包括评估维度设计、数据集准备、指标计算和自动化测试流程。

[Read More]

Agent强化学习的最佳实践:并行任务处理与性能优化

从单线程到高性能并发:构建可扩展的AI Agent系统

在2026年的AI应用场景中,Agent系统已经成为解决复杂任务的核心技术。无论是代码生成助手、自动化运维系统,还是智能客服机器人,如何让Agent高效地处理多个任务并从经验中学习,直接决定了系统的实用性和用户体验。本文将深入探讨Agent强化学习的工程实践,重点解决一个关键问题:如何让Agent并行处理任务以提升性能?

[Read More]