过去两年,几乎每家企业都在谈"拥抱 AI"。但你去看看大多数企业的 AI 落地项目,会发现一个尴尬的现实:聊天机器人做了一堆,效率提升约等于零。 问题出在哪?不是 AI 不够强,而是企业的数字化基座根本不是为 AI 设计的。
我越来越确信一个判断:AI 时代的企业数字化,可以浓缩成一个公式——
企业数字化 = 工作 Agent 化 + 知识 AI Ready 化 + 软件 CLI 化
这三项缺一不可,而且顺序很重要。
为什么传统数字化接不住 AI?
过去十年的企业数字化,核心是"把线下流程搬到线上"。结果是什么?ERP、OA、CRM、HR 系统堆了一堆,每个系统都有一个精美的 Web UI,每个流程都需要人去点击、填表、审批。
这套体系对人类用户已经足够好了,但对 AI Agent 来说,几乎完全不可用:
- Agent 不会"点击按钮"。 它没有眼睛,看不到你的 Web 页面。用 RPA 模拟点击?那是上一代的笨办法,脆弱、低效、不可维护。
- Agent 读不懂你的"知识"。 你的 SOP 是一份 200 页的 PDF,你的产品文档散落在 Confluence 的 500 个页面里,你的业务规则藏在某个老员工的脑子里。Agent 拿到这些,跟拿到一堆噪音没区别。
- Agent 没有自主权。 即使它知道该怎么做,也没有一条路径可以从"知道"到"做到"。因为所有操作都被锁在了 GUI 背后。
所以问题的根源很清楚:过去的数字化是为人设计的,而 AI 时代的数字化必须同时为人和 Agent 设计。 这不是在原有系统上"加个 AI 功能"就能解决的——它需要重新思考三个基本问题:工作怎么分配、知识怎么组织、软件怎么交互。
第一根支柱:工作 Agent 化
“工作 Agent 化"不是说把所有工作都交给 AI。而是说:每一项工作都应该被设计成"Agent 可以参与"的形态。
从"人执行"到"人定义、Agent 执行”
传统的工作模式是:领导分配任务 → 员工理解任务 → 员工执行任务 → 员工汇报结果。这个链条中,“理解"和"执行"强耦合在同一个人身上。
Agent 化的工作模式是:人负责定义"做什么"和"做到什么程度”,Agent 负责"怎么做"。
这听起来像是在描述自动化。但 Agent 化和传统自动化有一个本质区别:自动化是预设路径,Agent 化是目标驱动。 自动化脚本遇到意外情况就会报错退出,而 Agent 可以根据上下文自主判断、调整策略、甚至寻求帮助。
什么样的工作最适合 Agent 化?
并非所有工作都适合立刻 Agent 化。一个简单的判断标准:
Agent 化优先级矩阵
高频 + 规则明确 → 立即 Agent 化(报表生成、数据校验、格式转换)
高频 + 规则模糊 → 人机协作模式(客户沟通、内容审核、代码审查)
低频 + 规则明确 → 按需 Agent 化(系统部署、环境搭建)
低频 + 规则模糊 → 暂时保留人工(战略决策、创意设计)
关键不在于一步到位,而在于让每一项工作都有一个清晰的 Agent 化路径。今天是人干的活,明天可能就能交给 Agent——前提是你从一开始就按照可 Agent 化的方式来定义和管理它。
实践中的 Agent 化
在我自己的实践中,Agent 化的核心是把任务描述从"隐性知识"变成"显性指令"。比如写博客这件事:
- Agent 化之前:打开编辑器,想标题,写内容,调格式,手动提交。整个过程依赖我的肌肉记忆和个人偏好,无法委托给任何人。
- Agent 化之后:我把写作规范写成了 SKILL.md,把项目约定写进了 CLAUDE.md,把常用流程做成了 Skill。现在我只需要一句话描述主题,Agent 就能生成结构完整的文章,自动放到正确的目录,自动提交推送。
这篇文章本身就是 Agent 化的产物。但注意——我定义了"写什么"和"怎么算好",Agent 执行了"怎么写"。 这就是工作 Agent 化的本质。
第二根支柱:知识 AI Ready 化
如果说工作 Agent 化解决的是"谁来干"的问题,那知识 AI Ready 化解决的就是"凭什么干得好"的问题。
什么是 AI Ready 的知识?
一个残酷的事实:你公司 90% 的知识对 AI 来说是不可用的。
- 那份 Word 写的操作手册?Agent 能读,但读出来的是一堆无结构的文字。
- 那个 Confluence 空间里的文档?可能有 30% 是过期的,Agent 没法判断哪些还有效。
- 那些存在老员工脑子里的"口口相传"的经验?Agent 根本接触不到。
AI Ready 的知识需要满足几个条件:
1. 结构化。 不是一篇长文,而是有层级、有标签、有明确适用范围的知识片段。
2. 可寻址。 每条知识都有唯一的定位方式,Agent 可以精确找到它需要的那一条,而不是被迫读完全部。
3. 有时效标记。 每条知识都标注了创建时间、最后验证时间、适用版本,Agent 可以自己判断是否过期。
4. 机器可解析。 Markdown > Word,YAML > 自然语言描述,结构化数据 > 非结构化数据。
从文档到知识工程
把知识变成 AI Ready,不是简单的"文档数字化"——那是上一代的思路。它更接近于知识工程:
传统文档管理 AI Ready 知识工程
─────────────── ──────────────────
一份 200 页的 SOP → 拆解为 50 个独立的操作指南,每个有明确的触发条件
"经验丰富的老王知道怎么处理" → 把老王的经验写成决策树或规则文件
散落在各处的 FAQ → 统一的知识库,带语义索引和版本管理
每年更新一次的制度文件 → 持续维护的 living document,每次变更都有记录
我在 Workspace + Git + Agent 这篇文章中详细讨论过:Agent 的认知质量取决于它能获取的上下文质量。 CLAUDE.md 写得好,Agent 就表现好;知识库组织得好,Agent 就能做出正确的判断。
这不是什么高深的道理。但落到实践中,大多数企业连最基本的知识结构化都没做到。它们急着用 RAG 建知识问答系统,却不愿意花时间把知识本身整理成机器友好的格式。结果就是——垃圾进,垃圾出。
最小可行的知识 AI Ready 化
不需要一步到位。从三件事开始:
- 把最核心的业务规则写成 Markdown 文件,用清晰的标题层级和列表组织,而不是长段落叙述。
- 给每份文档加上元数据:适用场景、最后更新时间、负责人。
- 淘汰过期信息:知识库的价值不在于多,在于准。过期的文档比没有文档更危险,因为 Agent 会信以为真。
第三根支柱:软件 CLI 化
前面两根支柱解决了"Agent 知道该干什么"和"Agent 有知识基础"的问题。但还差最后一环:Agent 得有能力真正去操作。 这就是软件 CLI 化要解决的问题。
GUI 是给人用的,CLI 是给 Agent 用的
这是一个关键认知:图形界面(GUI)是为人类的视觉和手指设计的,命令行接口(CLI)是为程序化调用设计的。 AI Agent 本质上是一个程序,它天然适合通过 CLI 和 API 与软件交互。
看看 AI Agent 目前最擅长的领域——软件开发。为什么?因为开发者的工具链天然就是 CLI 化的:
git commit -m "fix: resolve login bug" # 版本控制
npm test # 运行测试
docker build -t myapp . # 构建部署
gh pr create --title "Feature X" # 创建 PR
curl -X POST api.example.com/deploy # 触发部署
每一个操作都可以用一行命令完成。Agent 不需要"看到"任何界面,不需要找按钮在哪里,不需要填表单——一行命令,精确操作,确定性结果。
现在想想你们公司的业务系统:要创建一个客户,需要登录 CRM → 点击"新建客户" → 填写 15 个字段 → 点击保存。Agent 怎么做这件事?它做不了——除非你给它一个 CLI 或者 API:
crm customer create --name "Acme Inc" --industry "tech" --contact "john@acme.com"
CLI 化不等于重建系统
软件 CLI 化不是让你推倒现有系统重来。它的核心是:为现有系统补上一层程序化接口。
具体的实现路径有很多:
最轻量:包装现有 API 为 CLI 工具
大多数现代 SaaS 系统都有 REST API。你需要做的,只是用一个薄薄的 CLI 包装层把这些 API 暴露出来:
# 用 Python Click 包装现有 API 为 CLI
import click
import requests
@click.group()
def crm():
"""CRM system CLI interface"""
pass
@crm.command()
@click.option('--name', required=True, help='Customer name')
@click.option('--industry', help='Industry category')
@click.option('--contact', help='Primary contact email')
def create_customer(name, industry, contact):
"""Create a new customer record"""
resp = requests.post('https://crm.internal/api/customers', json={
'name': name,
'industry': industry,
'contact_email': contact
})
click.echo(f"Customer created: {resp.json()['id']}")
# generated by hugo's coding agent
进阶:MCP Server 化
比 CLI 更进一步的是把系统能力封装为 MCP(Model Context Protocol)Server。MCP 是一个正在成为行业标准的协议,它让 AI Agent 可以直接发现和调用外部系统的能力,就像浏览器发现和调用 Web API 一样自然。
长期:新系统 CLI First
如果你在建新系统,应该采用 CLI First 的设计理念——先设计 CLI 接口,再建 GUI。这不是倒退,而是面向未来:
CLI First 设计流程:
1. 定义核心操作的命令行接口
2. 确保每个操作都可以通过 CLI 完成
3. 在 CLI 之上构建 GUI(GUI 调用 CLI 同样的底层逻辑)
4. GUI 和 CLI 共享同一套权限、验证、审计体系
这样做的好处是:人类用户用 GUI,AI Agent 用 CLI,两者操作的是同一个系统,遵守同样的规则,产生同样的审计日志。
为什么是 CLI 而不只是 API?
有人会问:直接开放 API 不就行了,为什么还要包一层 CLI?
原因是:CLI 是 Agent 最自然的工具调用方式。 当前主流的 AI Agent 框架(包括 Claude Code)都是通过 shell 执行命令来与外部系统交互的。CLI 提供了几个 API 不具备的优势:
- 自描述性。
crm customer create --help就能看到所有参数和说明,Agent 可以自行探索工具的用法。 - 可组合性。 CLI 工具可以通过管道组合,就像 Unix 哲学一样:
crm customer list --format json | jq '.[] | .name'。 - 可审计性。 每一条命令都是明文的,可以记录、回放、审查。这对企业的合规要求至关重要。
- 低门槛。 写一个 CLI 工具比建一个完整的 API 服务简单得多,可以快速验证 Agent 化的可行性。
三根支柱如何协同
这三件事不是孤立的。它们构成了一个完整的闭环:
┌──────────────┐
│ 人类决策者 │
│ 定义目标和标准 │
└──────┬───────┘
│
▼
┌─────────────────┐
│ 工作 Agent 化 │
│ Agent 接收并执行 │
│ 拆解后的任务 │
└───────┬─────────┘
/ \
/ \
▼ ▼
┌──────────────┐ ┌──────────────┐
│知识 AI Ready化│ │ 软件 CLI 化 │
│Agent 获取正确 │ │Agent 通过命令 │
│的上下文和规则 │ │执行实际操作 │
└──────────────┘ └──────────────┘
- 没有 Agent 化的工作设计,知识再好、CLI 再全,也没有人(Agent)去用。
- 没有 AI Ready 的知识,Agent 有手有脚但没有脑子,执行质量无法保证。
- 没有 CLI 化的软件,Agent 有脑子有想法但没有手脚,什么也做不了。
这就是为什么很多企业的 AI 项目只停留在"聊天机器人"阶段——它们只做了知识问答(知识的部分 AI Ready 化),但没有做工作的 Agent 化和软件的 CLI 化。 Agent 能回答问题,但不能执行动作。
从哪里开始?
如果你认同这个公式,下一步应该怎么做?建议从一个小闭环开始:
1. 选一项高频、规则明确的工作。 比如"每天生成销售日报"。
2. 把这项工作需要的知识整理成 AI Ready 的格式。 日报的模板、数据源的位置、计算规则、异常情况的处理方式——全部写成结构化文档。
3. 确保执行这项工作所需的系统操作都有 CLI 或 API。 从数据库拉数据?确保有命令行工具。发送邮件?确保有 CLI。生成报表?确保有命令可以调用。
4. 让 Agent 跑通这个闭环。 从理解任务、获取知识、执行操作到输出结果,全流程 Agent 完成。
一个闭环跑通了,你就知道下一个可以 Agent 化的工作是什么。滚雪球效应会自然启动——因为你为第一个闭环整理的知识和建设的 CLI,往往也能被后续的 Agent 任务复用。
总结
AI 时代的企业数字化,不是在现有系统上叠加一个 AI 聊天框。它需要从三个维度重新设计企业的数字化基座:
- 工作 Agent 化:让工作从"人执行"变成"人定义、Agent 执行",核心是把隐性知识变成显性指令。
- 知识 AI Ready 化:让知识从"人能看懂"变成"机器能理解",核心是结构化、可寻址、有时效。
- 软件 CLI 化:让软件从"只有人能操作"变成"Agent 也能操作",核心是为每个系统补上程序化接口。
这三件事构成了一个完整的 Agent 工作闭环。缺任何一环,AI 都只能停留在"玩具"阶段。企业真正的 AI 竞争力,不在于用了多先进的模型,而在于它的工作、知识和软件是否已经为 Agent 准备好了。