上周五晚上,我让 AI 帮我做一件事:把过去三个月收集的 47 篇关于 Agent 架构的文章、12 段会议笔记、和 6 个项目的 README,整理成一份「哪些架构模式真正有效」的判断。
如果是一年前,我会得到一份按关键词频率排列的摘要——看起来专业,实际上没用。
但这次不同。AI 花了大约 40 秒,输出了一份结构清晰的报告:哪些模式在多个项目中反复出现、哪些只在特定场景下有效、我的笔记里对同一问题有过矛盾的判断。它甚至指出了我在三月份写的一段话和五月份的一个项目决策之间的矛盾。
这不是搜索,不是摘要,不是 RAG 的简单检索。这是 理解。
那一刻我意识到一件事:我们正在经历大模型应用的第二次爆发。第一次是编程,第二次是知识管理。
编程为什么成了第一个爆发场景
先回答一个前置问题:为什么是编程?
2026 年,AI 编程助手市场已达 60 亿美元,年复合增长率 22%。Cursor 在不到两年内做到 20 亿美元 ARR,成为 SaaS 历史上增长最快的公司。Claude Code 占据企业市场 54% 的份额,八个月增长 6 倍。这些数字背后有一个简单的逻辑:
代码是大模型能「闭环验证」的第一种人类产出物。
什么意思?当你让 AI 写一段 Python 函数,你可以立刻运行它。测试通过就是对的,报错就是错的。这个反馈循环是确定性的、自动化的、无需人类介入的。大模型在这个场景下可以从「生成→验证→修正」的循环中快速收敛到正确答案。
这解释了为什么编程成为第一个爆发场景——不是因为程序员最聪明或最有钱,而是因为 代码的可验证性让 AI 的能力曲线得以陡峭上升。
但这个逻辑正在向第二个领域扩展。
知识和代码的深层同构
表面上看,知识管理和编程毫无关系。一个是整理笔记、归档文档、提炼洞察;另一个是写函数、调试、部署。
但从大模型的视角看,它们有三个关键的结构性相似:
一、都是「上下文依赖」的产出
写代码时,AI 需要理解当前文件、import 关系、项目约定。整理知识时,AI 需要理解你的笔记体系、关注领域、过去的判断和立场。
两者的核心挑战都是 上下文工程 (Context Engineering)——如何把足够的背景信息喂给模型,让它在「理解」的基础上「生成」。
我在 SKILL.md 不是文档,是编译器 中详细讨论过这个问题:一个 900 行的 SKILL.md 文件,本质上就是在给 AI 编译出一套「理解上下文的运行时」。
二、都有「补全」范式
Copilot 的核心交互是 代码补全——你写一半,AI 续一半。知识管理正在出现同样的范式: 知识补全。
你写了一段关于「多 Agent 协作」的笔记,AI 可以补全:
- 你之前在其他项目中关于这个话题的思考
- 与你观点矛盾的文献
- 你还没考虑到的边界情况
- 基于你的笔记推导出的下一步行动
这不是 RAG 的简单检索。RAG 回答的是「我的文档里有没有相关内容」。知识补全回答的是「基于我已有的思考,接下来应该想什么」。
我在 深入理解 RAG 中分析过 RAG 的局限性——它擅长检索,但不擅长推理和综合。知识补全需要的正是 RAG 之上的那一层。
三、都受益于「结构化约束」
代码有类型系统、语法规则、架构模式。知识也有结构:概念之间的因果关系、时间线、分类体系、判断标准。
当知识被结构化(不是指数据库,而是指「有明确的关系和层次」),大模型就能像在代码库中一样进行 有约束的推理,而不是在无边无际的文本中漫游。
知识补全栈:一个五层模型
我把正在出现的 AI 知识管理系统抽象成一个五层栈,每一层对应编程领域的一个概念:
┌─────────────────────────────────────────────────┐
│ ⑤ 知识生成 (Generation) │
│ 基于积累的知识,生成新的判断和洞察 │
│ 类比:代码生成 │
├─────────────────────────────────────────────────┤
│ ④ 知识综合 (Synthesis) │
│ 跨文档、跨时间段地综合,发现模式和矛盾 │
│ 类比:代码重构 │
├─────────────────────────────────────────────────┤
│ ③ 知识补全 (Completion) │
│ 基于已有上下文,补全缺失的思考和关联 │
│ 类比:代码补全 │
├─────────────────────────────────────────────────┤
│ ② 知识组织 (Organization) │
│ 自动分类、打标签、建立关联、检测冗余 │
│ 类比:代码格式化 / Linting │
├─────────────────────────────────────────────────┤
│ ① 知识采集 (Capture) │
│ 从对话、文档、会议、网页中自动提取知识 │
│ 类比:代码输入 / 版本控制 │
└─────────────────────────────────────────────────┘
2024-2025 年,大部分产品停留在第 ①② 层——NotebookLM 的 Audio Overviews 是采集层的产品,Notion AI 的自动标签是组织层的产品。
2026 年,第 ③④ 层正在快速成熟。Google 把 NotebookLM 整合进 Gemini 的 Notebooks 功能,就是一个信号——它不再只是一个「上传文档然后问答」的工具,而是一个有持久上下文、能跨对话积累理解的项目工作空间。
第 ⑤ 层——知识生成——是最终目标。AI 不只是帮你整理知识,而是基于你的知识体系 生成新的洞察。我在 用 LLM 构建程序化知识系统 中描述过这个方向:当 AI 的记忆(Memory)和技能(Skill)能持续进化,它就不再是工具,而是你的知识体系的延伸。
为什么是现在:三个技术拐点
知识管理的 AI 化不是新概念。Evernote 2008 年就开始了。为什么到现在才爆发?
拐点一:上下文窗口突破临界点。 2023 年,主流模型的上下文窗口是 4K-8K token,大概能放 3-5 页文档。2025 年,200K token 已是标配,能容纳一整本书。知识管理的核心是「在大量材料之间建立关联」,窗口太小,关联就不可能存在。
拐点二:持久记忆从实验变标配。 我在 Agent 设计最佳实践:Memory 中分析过,Agent 的记忆系统已经从「简单的对话历史」进化到包含短期记忆、长期记忆、程序性记忆的多层架构。这意味着 AI 可以真正「认识」你——不只是你这次说了什么,还有你一直以来的思考方式和偏好。
拐点三:从被动查询到主动参与。 传统知识管理是「你存了东西,然后去搜」。新的范式是 AI 主动参与知识的生命周期——在你写笔记时提示关联、在你读文章时提取要点、在你做决策时调取历史经验。这在 让 AI 自己写 Skill 中有具体的技术实现——当 AI 能自主将工作经验沉淀为可复用的技能,知识就不再是静态的档案,而是活的系统。
大模型编译,人类使用:知识管理的复利飞轮
三个拐点解决的是「技术上可行」的问题。但知识管理真正爆发的原因,不是技术成熟,而是 大模型恰好擅长知识管理中最难的那几件事。
知识结构化:从混沌到有序
人类最头疼的知识管理工作不是「写」,而是「整理」。你收藏了 5000 篇文章,但从来没有分类过。你有 200 段会议笔记,但从来没有人把它们关联起来。这些工作枯燥、重复、需要大量上下文理解——恰好是大模型最擅长的。
大模型可以:
- 从一段自由文本中提取 实体、关系、判断、前提条件,形成结构化表示
- 检测跨文档的 矛盾、冗余、时间线冲突
- 把零散的笔记自动归类到你已有的知识框架中
- 发现你遗漏的关联——「你三月写的这段和五月那篇论文说的是同一个问题」
这不是简单的 NLP 分类。这需要 理解语义、理解语境、理解你的知识体系的意图。三年前没有一个传统系统能做到这一点。大模型天然就是一个「知识编译器」——把非结构化的人类思维,编译成结构化的、可推理的知识表示。
程序化:知识变成可执行的工作流
结构化是基础,程序化才是杠杆。当知识被结构化之后,它就不再只是「文档」,而是 可执行的程序。
我在 SKILL.md 不是文档,是编译器 中展示过这个范式:一个 SKILL.md 文件不是一份说明书,而是一段被大模型执行的「程序」。当你说「写一篇博客」,AI 不是从零开始猜测,而是加载这个文件、按预定义的流水线执行。
同样的逻辑适用于所有知识:
- 你的「项目复盘方法论」可以变成一个 SKILL,每次复盘时自动执行
- 你的「代码审查标准」可以变成一个 SKILL,AI 在 Review 时自动对照
- 你的「决策框架」可以变成一个 SKILL,做决策时 AI 自动拉出历史案例
知识的程序化意味着:你思考过一次的框架,不需要每次重新思考。 大模型替你「编译」了思考过程,下次直接用。
迭代进化:越用越准
但程序化知识不是静态的。它需要进化——这就是人类反馈的价值所在。
这里有一个精妙的分工:
大模型负责 人类负责
┌──────────────┐ ┌──────────────┐
│ 编译知识 │ │ 使用知识 │
│ 结构化整理 │──── 输出 ────▶│ 做出判断 │
│ 发现关联 │ │ 提供反馈 │
│ 补全缺失 │◀─── 反馈 ────│ 纠正错误 │
│ 迭代更新 │ │ 标记过时 │
└──────────────┘ └──────────────┘
│ │
└───── 复利效应:知识越积累,
AI 理解越深,输出越准 ─────┘
大模型编译知识、人类使用并判断、反馈回流修正模型对知识的理解——这个循环每转一圈,整个系统就变强一点。
这就是 复利效应。和传统知识管理不同,传统系统里你记了 1000 条笔记,第 1001 条笔记并不会让前 1000 条变得更好。但在大模型驱动的知识系统中,你每一次使用、每一次反馈,都在让整个知识库变得更精准。第 1001 次交互,比第 1 次交互产出的质量高一个数量级。
这也解释了为什么知识管理的护城河不是模型能力,而是 积累。你在这个系统里待得越久,AI 对你的理解越深,你越不可能迁移到另一个系统——因为另一个系统从零开始,而你在这个系统里已经有了两年的「复利」。
编程 vs 知识管理:一张对比表
| 维度 | AI 编程 | AI 知识管理 |
|---|---|---|
| 核心交互 | 代码补全 | 知识补全 |
| 反馈循环 | 确定性(编译/测试) | 模糊性(需要人类判断) |
| 市场规模 | ~60 亿美元(2026) | ~22 亿美元(2026),CAGR 30% |
| 成熟度 | 补全层成熟,生成层爆发中 | 采集/组织层成熟,补全/综合层爆发中 |
| 杀手级产品 | Cursor, Claude Code | NotebookLM+, Gemini Notebooks |
| 上下文需求 | 代码库 + 项目约定 | 个人知识体系 + 领域背景 |
| 验证方式 | 自动化(CI/CD) | 人类判断(需要设计评估框架) |
| 护城河 | 模型能力 + 编辑器体验 | 个人数据积累 + 上下文理解深度 |
| 网络效应 | 弱(个人工具) | 强(知识越多越有用) |
| 切换成本 | 中(换编辑器) | 极高(换系统 = 丢失上下文) |
最后两行是关键差异。AI 编程工具之间的切换成本是中等——你换个编辑器,代码还是你的。但知识管理系统的切换成本极高,因为你的知识体系、AI 对你的理解、积累的程序性记忆,都是不可迁移的。
这意味着: 知识管理是一个赢家通吃的市场,而且赢家由数据积累决定,不由模型能力决定。
比编程更难的地方
知识管理不会简单地复制编程的爆发路径。有三个根本性的难点:
1. 验证是模糊的
代码跑通了就是对的。但「这份知识整理得好不好」没有自动化测试。你需要设计评估框架——就像我在 一个会自己写博客的系统 中设计的五维评分体系(hook、insight、framework、technical、structure),知识管理也需要类似的评估机制来判断 AI 的输出质量。
2. 知识有「保质期」
代码库可以重构,但知识有过时的问题。你 2024 年关于 AI 的判断,到 2026 年可能完全不成立。知识管理系统需要一个「知识衰减」机制——自动标记过时内容,提示你重新审视旧判断。编程世界没有这个问题,因为旧代码跑不起来你会立刻发现。
3. 隐私和信任
你愿意让 AI 读你的代码,因为代码是公司资产。但你愿意让 AI 读你所有的笔记、想法、未成形的判断吗?知识管理涉及的是更私密的思维过程,信任建立的门槛更高。这也是为什么本地优先(local-first)的知识管理方案正在获得更多关注。
对个人和对组织的不同含义
对个人: 你的笔记系统不再是一个存档柜,而是一个可以对话的「第二大脑」。但前提是你的笔记要足够结构化——不是为了 AI 而结构化,而是因为结构化本身就是思考的一部分。散乱的收藏夹不会变成知识,无论 AI 多强大。
对组织: 知识管理从「文档管理」升级为「组织智能」。当 AI 能理解整个团队的知识积累、项目经验、失败教训,它就不再是一个问答机器人,而是一个组织级的决策辅助系统。但这也意味着,组织知识管理面临更大的隐私和权限挑战——我在 从写代码到定义目标 中讨论过,AI 时代的组织变革不只是工具升级,而是权力结构的重塑。
第三波在哪里?
如果编程是第一波(AI 学会写代码),知识管理是第二波(AI 学会理解知识),第三波会是什么?
我的判断是 决策。当 AI 既会写代码、又理解你的全部知识积累,它就可以开始参与决策——不是替你做决定,而是帮你在复杂情境中看清选项、权衡利弊、预判后果。
但这需要知识管理层先成熟。没有扎实的知识基础,AI 做的「决策」不过是基于碎片信息的猜测。
所以,如果你现在要下注一个方向:
别去找下一个 Cursor。去找下一个「能理解你全部知识、并且越用越懂你」的系统。
那个系统不会长得像现在的任何笔记应用。它可能更像 一个会自己进化的知识体——不是一个工具,而是一个和你一起生长的数字伙伴。
你在日常工作中有没有感觉到 AI 在知识管理上的突破?还是觉得现在的产品还停留在「高级搜索」阶段?欢迎留言讨论。