修 Bug 的真正目的:让 AI 下次能自己修

Harness Engineering — Bug Fix as AI Training Data

一个工程师修了一个 Bug,ROI 是多少?

传统算法:节省了一次排查时间。AI 时代的算法:如果这个修复沉淀为 Harness 的一部分,AI 以后能自动修多少个类似的 Bug。

这就是思维范式的根本转变——你修的每一个 Bug,都是一次训练数据。不是训练模型,而是训练你项目周围的那套 Harness。

[Read More]

VOC 闭环:Windows 用户打不开悟空,AI 怎么用 4 小时从报错到发版

From VOC Signal to Code Fix — Building AI-Native Enterprise SOP

知识管理有四个值得做的企业场景,其中「企业 SOP / 最佳实践沉淀」看起来最不起眼——知识静态、更新慢、容易退化成高级搜索、用户日活偏弱。

但如果你换一个角度看,SOP 沉淀的真正价值不是「把经验存起来」,而是 把经验变成可执行的系统行为

这篇文章用一个完整案例来说明:一位 Windows 用户打开悟空发起任务,悟空报错「任务执行环境准备失败」,到 AI 定位根因、修复代码、验证、发布,全程 4 小时。每个环节 AI 做什么、人做什么、知识如何在这个过程中自然沉淀。

[Read More]

Context, is Control

From Prompt Engineering to Harness Engineering in Agent Management

Netflix 的「Context, not Control」曾经是最有影响力的管理理念之一。

它的核心假设很简单:给聪明人足够的上下文,他们会用你没想到的方式达成目标。你不需要控制过程,只需要提供信息、方向、约束。人的判断力、创造力、直觉——这些是 context 之外的东西,也是 Control 管不到的东西。

但这个理念套到 Agent 上,假设崩塌了。

Context is Control:从 Prompt Engineering 到 Harness Engineering

[Read More]

AI 时代的一万小时定律:从战术精通到系统思维

The 10,000-Hour Rule in the Age of AI: From Tactical Mastery to Systems Thinking

马尔科姆·格拉德威尔(Malcolm Gladwell)在《异类》中普及的"一万小时定律"曾是无数人自我提升的圣经:只要投入一万小时的刻意练习,任何人都能成为世界级专家。然而,随着 AI 技术的爆发式增长,这一定律正面临前所未有的挑战。

在 AI 能够以分钟级速度掌握规则型技能的今天,人类是否还需要花费一万小时去磨练战术技能?如果不需要,我们的一万小时应该投资在哪里?

[Read More]

悟空使用技巧:让 AI 向你提问,需求越明确执行效果越好

Interactive Prompt Clarification: Why Asking Questions Back Makes AI Agents Smarter

向 AI 提出需求后,不要急着让它立刻执行。一个简单却常被忽略的技巧是:让 AI 先向你提问,把模糊的需求打磨清晰。需求越明确,AI 的执行效果就越好。这不是理论,而是每天和 AI 协作的工程实践中,投入产出比最高的习惯。

[Read More]

AI 时代的代码大爆发:为什么未来 3 年会有更多人涌入软件行业?

The Code Explosion: Why the Software Workforce Will Grow, Not Shrink, in the AI Era

2024 年,GitHub 上产生了 2560 亿行 代码,其中 41% 由 AI 生成。

这是一个惊人的数字,但更惊人的是未来 3 年的预测:随着 AI 编程工具渗透率从 50% 飙升至 90% 以上,全球代码总量预计将增长 4 到 10 倍

面对这种指数级的生产力爆发,许多人的第一反应是恐慌:“程序员是不是要失业了?”

然而,经济学规律和历史经验告诉我们一个截然相反的结论:未来 3 年,从事软件行业的人数不仅不会减少,反而会迎来史无前例的增长。 软件行业正在经历一场从 “手工业” 到 “工业化” 的范式转移,而这场转移将吸纳海量的 “新从业者”。

[Read More]

把组织当成产品来打造:AI 原生组织的 MVP 设计

组织不是「管」出来的,是「设计」出来的——以钉钉团队为例,拆解组织 MVP 的第一个可用版本

去年底,钉钉内部发生了一件事。一个做智能客服的产品经理发现,他给企业客户做的 AI 解决方案,从需求确认到方案交付平均要 14 天。他拉了一下链路:客户提需求给销售(1 天)→ 销售转给解决方案团队(等 2 天)→ 解决方案写 PRD 转给产品(等 1 天)→ 产品评审排期(等 3 天)→ 技术实现(5 天)→ 交付验收(2 天)。14 天里,真正在"干活"的时间不到 5 天,剩下 9 天全是等待——等人、等审批、等排期、等信息同步。

他跑去找他的主管说:“我们给客户做 AI 提效工具,但我们自己的组织效率,比客户还低。”

这句话刺痛了人。但更刺痛的是——这不是钉钉一家的问题,这是几乎所有想做 AI 转型的公司都会撞上的墙。不是不知道终局应该长什么样,而是不知道第一个可用版本怎么做——像做产品一样,先跑起来,再迭代。

[Read More]

从泛化到进化:AI Agent 的下一站

泛化是空间维度的适应能力,进化是时间维度的适应能力

前几天跟一个做 Agent 平台的朋友聊天,他说了一句让我印象很深的话:“我们花了半年调 prompt,好不容易让 Agent 在电商客服场景跑到了 90 分。结果客户说要扩到金融场景,我们一测——40 分都不到。”

我问他打算怎么办。

他苦笑:“重新调呗。再花半年。”

这个对话浓缩了当前 AI Agent 面临的最核心矛盾:我们造出了能力惊人但本质上是"静态"的系统。它在训练过的分布上表现惊艳,换个分布就翻车;它部署的那一刻就被冻结,遇到新场景只能等人类手动干预、重新训练。

这让我开始思考两个看似不同、实则紧密相连的问题:泛化(Generalization)进化(Evolution)

[Read More]

AI 时代,人人都能建模了吗?

工具民主化了,但建模思维没有

上周有个做运营的朋友拿着一个 AI 帮他建的销量预测模型来找我,特别兴奋:“你看,R² = 0.89,是不是挺准的?”

我看了一眼,模型确实跑得不错。历史数据拟合得很好,特征工程也挺合理——用了过去 30 天的销量趋势、星期几、是否节假日。

我问他:“下周要下一整周的雨,你的模型知道吗?”

他愣了一下。

我又问:“竞品下周搞 618 预热大促,你的模型考虑了吗?你们市场部刚换了投放渠道,从抖音换到了小红书,这个变量在哪?”

他沉默了。

模型没有错。R² = 0.89 是真的。但这个模型不知道自己不知道什么。更要命的是,用这个模型的人也不知道。

这就是我今天想聊的事:AI 让建模的门槛低了,但这不等于人人都能建好模。

[Read More]

让 AI 自己写 Skill:可进化 Agent 的设计原理与最佳实践

Why procedural memory beats static prompts, and how to build skills that improve over time.

今天下午我做了一件听起来有点奇怪的事——让 AI 读完了我自己的 174 篇博客,提炼出写作风格,写成了一份可执行的配置文件,然后告诉它:“以后每次写文章就按这个标准来,写完还要自己更新它。”

它真的照做了。不仅生成了一份包含六大风格特征、两种文章模板、四个薄弱环节和改进路线图的 Skill 文档,还自动附加了一条"进化协议"——每次使用完毕后检查是否需要更新。

这不是 prompt engineering,也不是 RAG。这是给 Agent 建程序性记忆(Procedural Memory)。

很多人给 AI 配了知识库、写了几百行 system prompt,但用起来总觉得"不长进"。问题不在于模型,而在于记忆的结构。静态 prompt 是一次性指令,而可进化的 Skill 是活的——它会随着使用自动迭代、越用越准、越用越像你自己。

[Read More]