AI-Agents

Workspace + Git + Agent：AI 时代的工作操作系统

Everything is file——当所有 AI 工件都是文件，Workspace 的结构设计就是你的竞争力

Posted on March 6, 2026 | 5 min | 886 words

过去一年，我越来越确信一个判断：AI 时代真正的工作操作系统，不是某个 App，不是某个平台，而是 Workspace + Git + Agent 这个三位一体的组合。

为什么？因为 AI Agent 的一切——输入、输出、系统提示词、上下文、执行过程、临时生成的代码、图片、文档，甚至应用程序本身——本质上都是文件。既然 everything is file，那么管理这些文件的方式，就决定了你驾驭 AI 的效率和上限。

让 Agent 更准确地完成任务，关键不在模型，而在环境

干净环境、充足上下文、探索空间、工具能力——Agent 质量的四根支柱

Posted on March 5, 2026 | 2 min | 406 words

做了一年多 AI Agent 开发，我逐渐形成了一个核心观点：让 Agent 更准确更高质量地完成任务，最关键的不是换一个更强的模型，而是给它一个正确的执行环境。

具体来说，这个"正确的执行环境"包含四个要素：干净的执行环境、充足且正确的上下文、允许自我探索的空间、以及学会使用工具解决问题的能力。

以前人给 AI 造工具，现在 AI 自己造工具

从声明式工具调用到程序化工具调用（PTC），AI Agent 的工具范式正在发生根本性转变

Posted on March 4, 2026 | 2 min | 408 words

做 AI Agent 开发这一年多来，我经历了一个认知上的转变：以前的默认思路是"我要给 AI 准备好一切工具，让它去调用"；而现在，越来越多的场景让我意识到——AI 为了完成任务，会自己造工具。这不是一个隐喻，而是一个正在发生的技术事实。

[Read More]

AI AI-agents tool-use PTC Claude LLM architecture

大模型 Tool Use 准确率可达 99%，但前提是工具足够简单

为什么平台服务 Tools 化的最佳实践是写 CLI

Posted on March 2, 2026 | 2 min | 374 words

最近在做 Agent 开发时，我发现一个有意思的现象：大模型调用工具的准确率其实可以非常高，达到 99% 甚至更高——但这有一个关键前提：工具本身要足够简单。这也解释了一个行业趋势：越来越多的平台服务在做 Tools 化时，选择的路径是写 CLI，而不是暴露复杂的 SDK 或 REST API。

Agent 设计最佳实践：Memory

从每日日志到向量检索，深入解析 OpenClaw 如何让 AI 真正「记住」你

Posted on February 28, 2026 | 4 min | 700 words

想象这样一个场景：你花了半小时向 AI 助手解释你的项目架构、编码偏好和团队规范，得到了一次满意的协作体验。第二天再打开对话——它全忘了。你又得从头来一遍。这不是 AI 不够聪明的问题，而是记忆架构缺失的问题。OpenClaw 的 Memory 系统试图从根本上解决这个痛点：让 AI Agent 拥有持久、可检索、可自维护的记忆能力。

Agent 设计最佳实践：OpenClaw 的 Heartbeat 设计

让 AI 助手主动做事的心跳机制——从被动应答到主动巡检

Posted on February 28, 2026 | 3 min | 589 words

绝大多数 AI 助手都是被动的——用户不说话，它就沉默。这在"问答"场景下没问题，但如果你想让 AI 助手真正成为助手，它需要主动意识：定期检查收件箱有没有紧急邮件、日历上有没有即将到来的会议、GitHub 上有没有需要关注的 PR。OpenClaw 的 Heartbeat（心跳）机制正是为此设计的。本文将深入解析这一设计的工程细节和最佳实践。

OpenClaw 架构解析：如何构建一个有记忆、有灵魂的个人 AI 助手

从文件即记忆到多 Agent 协作，深入理解 OpenClaw 的设计哲学

Posted on February 25, 2026 | 4 min | 699 words

大多数 AI 助手是无状态的——你关掉窗口，它就忘了你是谁。OpenClaw 试图解决一个更本质的问题：能不能让 AI 助手像一个真正的助手一样，记住你、理解你、主动帮你？ 经过几周的实际使用，我想分享一下 OpenClaw 的架构设计和背后的思考。

Manus、Lovable、Dify、Coze 的本质：为大模型开发 Skills 的工具

当 AI 平台的护城河不再是技术本身，而是生态、用户规模和沉淀下来的数据

Posted on February 22, 2026 | 2 min | 242 words

2025 年以来，AI 应用层出现了一波令人眼花缭乱的平台：Manus 主打通用 AI Agent，Lovable 专注 AI 驱动的应用生成，Dify 提供 LLM 应用编排框架，Coze（扣子）让用户可以可视化地构建 AI Bot。它们看起来各有侧重，产品形态也不尽相同，但如果你退后一步观察，会发现它们在做的事情本质上是一样的——为大模型开发 Skills。

[Read More]

AI LLM AI-agents Manus Lovable Dify Coze AI-platform skills

如何对会议纪要 Agent 进行 Benchmark？完整指南与实践

从评估指标设计到自动化测试的全流程实战

Posted on January 7, 2026 | 7 min | 1307 words

在 AI Agent 应用日益普及的今天,会议纪要生成是最常见的落地场景之一。然而,如何科学地评估一个会议纪要 Agent 的性能,却是许多开发者面临的难题。本文将详细介绍如何构建一个完整的 benchmark 体系,包括评估维度设计、数据集准备、指标计算和自动化测试流程。

Agent强化学习的最佳实践：并行任务处理与性能优化

从单线程到高性能并发：构建可扩展的AI Agent系统

Posted on January 3, 2026 | 9 min | 1901 words

在2026年的AI应用场景中，Agent系统已经成为解决复杂任务的核心技术。无论是代码生成助手、自动化运维系统，还是智能客服机器人，如何让Agent高效地处理多个任务并从经验中学习，直接决定了系统的实用性和用户体验。本文将深入探讨Agent强化学习的工程实践，重点解决一个关键问题：如何让Agent并行处理任务以提升性能？