过去一年,我越来越确信一个判断:AI 时代真正的工作操作系统,不是某个 App,不是某个平台,而是 Workspace + Git + Agent 这个三位一体的组合。
为什么?因为 AI Agent 的一切——输入、输出、系统提示词、上下文、执行过程、临时生成的代码、图片、文档,甚至应用程序本身——本质上都是文件。既然 everything is file,那么管理这些文件的方式,就决定了你驾驭 AI 的效率和上限。
[Read More]过去一年,我越来越确信一个判断:AI 时代真正的工作操作系统,不是某个 App,不是某个平台,而是 Workspace + Git + Agent 这个三位一体的组合。
为什么?因为 AI Agent 的一切——输入、输出、系统提示词、上下文、执行过程、临时生成的代码、图片、文档,甚至应用程序本身——本质上都是文件。既然 everything is file,那么管理这些文件的方式,就决定了你驾驭 AI 的效率和上限。
[Read More]做了一年多 AI Agent 开发,我逐渐形成了一个核心观点:让 Agent 更准确更高质量地完成任务,最关键的不是换一个更强的模型,而是给它一个正确的执行环境。
具体来说,这个"正确的执行环境"包含四个要素:干净的执行环境、充足且正确的上下文、允许自我探索的空间、以及学会使用工具解决问题的能力。
[Read More]做 AI Agent 开发这一年多来,我经历了一个认知上的转变:以前的默认思路是"我要给 AI 准备好一切工具,让它去调用";而现在,越来越多的场景让我意识到——AI 为了完成任务,会自己造工具。这不是一个隐喻,而是一个正在发生的技术事实。
[Read More]最近在做 Agent 开发时,我发现一个有意思的现象:大模型调用工具的准确率其实可以非常高,达到 99% 甚至更高——但这有一个关键前提:工具本身要足够简单。这也解释了一个行业趋势:越来越多的平台服务在做 Tools 化时,选择的路径是写 CLI,而不是暴露复杂的 SDK 或 REST API。
[Read More]想象这样一个场景:你花了半小时向 AI 助手解释你的项目架构、编码偏好和团队规范,得到了一次满意的协作体验。第二天再打开对话——它全忘了。你又得从头来一遍。这不是 AI 不够聪明的问题,而是记忆架构缺失的问题。OpenClaw 的 Memory 系统试图从根本上解决这个痛点:让 AI Agent 拥有持久、可检索、可自维护的记忆能力。
[Read More]绝大多数 AI 助手都是被动的——用户不说话,它就沉默。这在"问答"场景下没问题,但如果你想让 AI 助手真正成为助手,它需要主动意识:定期检查收件箱有没有紧急邮件、日历上有没有即将到来的会议、GitHub 上有没有需要关注的 PR。OpenClaw 的 Heartbeat(心跳)机制正是为此设计的。本文将深入解析这一设计的工程细节和最佳实践。
[Read More]大多数 AI 助手是无状态的——你关掉窗口,它就忘了你是谁。OpenClaw 试图解决一个更本质的问题:能不能让 AI 助手像一个真正的助手一样,记住你、理解你、主动帮你? 经过几周的实际使用,我想分享一下 OpenClaw 的架构设计和背后的思考。
[Read More]2025 年以来,AI 应用层出现了一波令人眼花缭乱的平台:Manus 主打通用 AI Agent,Lovable 专注 AI 驱动的应用生成,Dify 提供 LLM 应用编排框架,Coze(扣子)让用户可以可视化地构建 AI Bot。它们看起来各有侧重,产品形态也不尽相同,但如果你退后一步观察,会发现它们在做的事情本质上是一样的——为大模型开发 Skills。
[Read More]在 AI Agent 应用日益普及的今天,会议纪要生成是最常见的落地场景之一。然而,如何科学地评估一个会议纪要 Agent 的性能,却是许多开发者面临的难题。本文将详细介绍如何构建一个完整的 benchmark 体系,包括评估维度设计、数据集准备、指标计算和自动化测试流程。
[Read More]在2026年的AI应用场景中,Agent系统已经成为解决复杂任务的核心技术。无论是代码生成助手、自动化运维系统,还是智能客服机器人,如何让Agent高效地处理多个任务并从经验中学习,直接决定了系统的实用性和用户体验。本文将深入探讨Agent强化学习的工程实践,重点解决一个关键问题:如何让Agent并行处理任务以提升性能?
[Read More]