企业业务流程 AI 化的决策框架

AI 时代企业 IT 变革的主要方向，是把业务流程优化成由 AI 来驱动，减少原有流程中人力的投入。但上个月，一个做企业数字化的朋友跟我说：他们花了大半年把内部流程都接上了 AI，看起来每个环节都有 AI 参与，人力成本却几乎没降。员工还是在填表、还是在审批、还是在做报表，AI 只是在旁边多了一个「建议」按钮。

我问他：你们到底是在让 AI 帮忙做，还是让 AI 来做？

这两件事有本质区别。前者是给现有流程加一个 AI 助手，人的角色不变，AI 只是辅助。后者是围绕 AI 重新设计流程，让 AI 成为主执行者，人从执行者变成审核者和判断者。

大多数企业的数字化停留在前者，因为前者不需要改变组织结构和人的工作方式。但真正的效率跃迁只在后者发生。

人的角色，在 AI 流程里收敛成两件事

最简单的例子是报销。AI 从发票照片里提取金额、商户、日期自动填好表单，再按报销政策做预审 —— 金额在限额内、类别合规、不是重复提交，就自动通过；只有异常单据才标记出来给人看。人从「每张都审」变成「只看异常」，原来每步都要人的流程，现在人只剩两个动作：审核 AI 标出来的异常，判断 AI 拿不准的灰色地带。

但报销是最容易 AI 化的那一类 —— 输入结构化（就是一张发票）、单轮、规则可枚举、出错能改。真正能检验「让 AI 来做」这套逻辑的，是另一类流程：长程、跨部门、输入全是非结构化的聊天和文档。项目管理就是典型。

每家企业都有项目管理系统，但大多数系统需要 PM 手动更新进度、汇总状态、同步信息、调整资源。项目成员在钉钉群里讨论进展，PM 要从一周几百条聊天记录、几份会议纪要、十几个文档更新里提取关键信息，再手动录回系统。大量时间花在信息搬运上，真正用于决策的时间反而很少。

传统的项目管理流程：

PM 手动录入 → PM 手动更新进度 → PM 手动汇总状态 → PM 手动同步团队 → PM 手动调整资源

每个环节都是 PM 在操作，而且这个循环每周重复、跨越整个项目周期。这正是它比报销难的地方：报销是一锤子买卖，项目管理是持续数周、串联多个角色的长程任务。

AI 驱动的项目管理流程：

AI 自动解析项目文档 → AI 实时同步项目数据 → AI 生成状态报告 → AI 预警风险
         ↓                    ↓
   钉钉 AI 表格（中间层）    悟空 Agent（执行层）
         ↓                    ↓
   结构化数据存储           智能分析决策
         ↓                    ↓
         └─────────┬──────────┘
                   ↓
          项目持续优化 ← PM 审核和判断

这里的关键是 钉钉 AI 表格作为 AI Ready 的结构化数据中间层。它把非结构化的聊天记录、会议纪要、文档更新，转化成有明确字段的结构化项目数据：

from dataclasses import dataclass, field
from datetime import date


@dataclass
class TaskRecord:
    """钉钉 AI 表格里一条任务的结构化字段——把群聊和文档里散落的信息，收敛成机器可读的状态。"""

    task_id: str
    owner: str                            # 从 @ 提及和上下文里识别负责人
    status: str                           # 未开始 / 进行中 / 已完成 / 阻塞
    due_date: date
    last_update: str                      # 最近一次进展的原文摘要
    risk_flag: bool = False               # 悟空 Agent 预警的风险标记
    blockers: list[str] = field(default_factory=list)
# generated by hugo AI

有了这个结构化中间层，悟空 Agent 才能基于干净的数据做分析：自动提取进度更新、识别风险点、生成周报、推荐资源调整方案。钉钉群的协同能力让信息透明流动，团队成员直接在群里看到 AI 生成的状态报告和风险预警。

PM 在这个流程里也只做两件事：

审核 —— 看 AI 生成的状态报告和风险预警，确认是否准确。原来每天花 1-2 小时手动更新，现在大约 15 分钟审核 AI 的输出（基于我的项目经验估算）。

判断 —— 处理 AI 无法决策的复杂情况：项目优先级冲突、跨部门的资源协调、客户需求变更的影响评估。这些依赖经验和上下文，AI 给不出答案。

从「PM 做所有事」到「PM 只做审核和判断」，PM 的工作量可能降低 70%（基于我的项目经验估算）。注意这 70% 省的是信息搬运，省不掉的恰恰是最难的那部分判断 —— 这一点后面还会回来谈。这不是给 PM 加了一个 AI 助手，是整个项目管理流程围绕 AI 重新设计了。

收敛的本质：从执行者到决策者

报销和项目管理，一个简单一个复杂，但人的角色变化是同一个方向： 人在 AI 驱动的流程里，从执行者收敛成审核者和判断者。

审核是看 AI 的输出。AI 生成了周报，人看一遍有没有事实错误。AI 预审了报销单，人抽查异常。AI 起草了客户回复，人检查语气是否得体。

判断是处理 AI 搞不定的模糊地带。客户投诉里情绪特别激动的，AI 标出来转人工。两个候选人条件差不多，人选哪个。供应商交货延迟率突然升高，是季节性波动还是系统性问题。

这个收敛意味着组织设计要跟着变：

岗位重新定义。 原来十个人干活的团队，现在可能两个人加八个 AI Agent。但这两个人的能力要求变了 —— 不是手快，是眼光准，能看出 AI 没发现的异常。

异常处理变成核心能力。 正常流程 AI 跑，人专门处理 AI 搞不定的 edge case。这部分经验反而更值钱，因为它直接决定了 AI 能不能接管更多流程。

信任建立是个渐进过程。 还是拿项目管理说：刚上线时 PM 审核 100% 的 AI 输出，跑顺了降到 50%，再降到 10%。但降到多少合适，每个业务场景不一样，需要数据驱动而不是拍脑袋。

这里要正面回应一个最容易被忽略的反方： 如果人只剩下处理那 10% 的异常，省下的人力成本会不会被这 10% 吃掉？ 毕竟异常恰恰是最难、最需要资深人力的部分。我的看法是：不会，但前提是异常比例真的能压到低位。AI 接管 90% 的常规流程后，资深的人从重复劳动里解放出来，专注在高价值的判断上 —— 单位异常的处理成本确实更高，但总量小到足以让整体人力大幅下降。反过来，如果异常比例压不下去（长期停在 30% 以上），那说明这个流程根本不该硬上 AI —— 这正是下面的决策框架要解决的问题。

不是所有流程都该 AI 化

识别出「人收敛到审核和判断」只是第一步。下一步是决定哪些流程先 AI 化、哪些该等等。我在 AI 时代的企业数字化里提过三个支柱 —— 工作 Agent 化、知识 AI Ready 化、软件 CLI 化 —— 但知道方向之后，更具体的问题是：哪些流程先做？这需要一套评估方法。

第一个轴：ROI

AI 化一个流程能省多少钱？有五个因子要算：

因子	怎么算	容易忽略的点
人力成本节省	现有工时 × 人均成本 × AI 替代比例	审核人力还在，不是 100% 替代
错误率下降	返工成本 × 改善幅度	要对比 AI 新引入的错误和原有错误
速度提升	周期缩短 × 时间价值	真正的瓶颈往往不是流程慢，而是人没时间看
规模弹性	业务量翻倍时成本是否线性增长	AI 的边际成本很低，业务增长时利润结构显著改善
AI 运行成本	模型调用 + 开发维护 + 人审核成本	审核人力不能忘，可能占原来的 20-30%

最常见的坑是漏算审核人力。很多方案算 ROI 时假设 AI 替代了 100% 的人力，实际上人审核的成本可能还剩 20-30%。把这个成本漏掉，ROI 就虚高了 —— 这也是前面那个「省下的成本会不会被异常吃掉」反方的量化版本。

另一个容易被低估的是规模弹性。传统流程里业务量翻倍意味着人力翻倍，AI 流程里模型调用的边际成本很低，这意味着业务增长时利润率会显著改善。拿项目管理说，PM 能带的项目数量原来受手动工时上限约束，AI 接管信息搬运后，同一个 PM 能盯的项目数量可以成倍增长。但这个优势在业务量小的时候体现不出来，容易被忽略。

第二个轴：技术可行性

算清楚 ROI 之后，要评估技术上能不能做。五个维度：

维度	高可行性	低可行性
数据结构化程度	表单字段明确	大量非结构化输入（长邮件、语音、照片）
决策规则	可枚举、有标准答案	依赖经验直觉、模糊判断
容错空间	错了能改回来	错了不可逆（财务出账、法律文书）
上下文依赖	单流程内闭环	跨系统、跨部门串联
异常比例	低于 5% 需要人介入	频繁出现非标情况

数据结构化程度往往是第一道门槛。AI 处理结构化表单的能力已经很成熟，但涉及大量非结构化输入时准确率会显著下降。

容错空间决定了人审核的比例。内部周报写错了可以改，财务报表出错了可能要担法律责任。容错空间越小的流程，人审核的比例就越高，ROI 也就越低。

回到项目管理。按这五个维度打分，它一开始是个不折不扣的「难」案例：输入是非结构化的聊天和文档（数据结构化低）、要跨部门串联（上下文依赖高）。直接上 AI，准确率根本撑不起来。钉钉 AI 表格中间层做的事，本质就是把「数据结构化程度」这一维从低拉到高 —— 先把散落的信息收敛成结构化字段（就是前面那个 TaskRecord），悟空 Agent 才有干净的数据可处理。换句话说， 可行性不是流程的固有属性，而是可以靠基础设施改造的。 这一点决定了下面的决策矩阵不是一张静态的图。

决策矩阵

把两个轴交叉，得到一个简单的决策框架：

技术可行性
  高 ┃  ★ 优先做           │  ⚡ 快速试点
     ┃  ROI 高 + 能做       │  ROI 低但成本也低
  ───╋─────────────────────┼────────────────────
  低 ┃  🔭 等模型进步        │  ✗ 暂时不做
     ┃  ROI 高但做不了       │  ROI 低 + 做不了
     ┗━━━━━━━━━━━━━━━━━━━━━┻━━━━━━━━━━━━━━━━━━━
           高                     低
                        ROI

优先做 —— 高 ROI 加高可行性。比如报销预审、常规审批、日报生成。结构清晰、容错空间大、人力投入高，是最理想的切入点。

等模型进步 —— 高 ROI 但技术可行性低。比如合同审核、复杂财务分析。值得持续跟踪，因为模型能力在快速迭代。

快速试点 —— 低 ROI 但技术可行性高。虽然直接回报不高，但实施成本低，可以作为团队练手和基础设施验证的机会。

暂时不做 —— 低 ROI 加低可行性。不用浪费资源。

把前面的两个案例放进这个矩阵，能看出它其实是动态的。报销结构化、容错大、人力投入高，天生就在「优先做」象限，没什么悬念。 项目管理 才是有意思的那个 —— 在没有结构化中间层的时候，它 ROI 很高（PM 的人力消耗巨大）但技术可行性低，落在「等模型进步」象限；钉钉 AI 表格把数据结构化这一维拉上来之后，它整体右移、上移到了「优先做」。同一个流程，因为基础设施变了，在矩阵里换了象限。

关键一点：可行性不是固定的

项目管理换象限这件事，揭示了这个矩阵最容易被忽略的特性 —— 技术可行性不是固定的，它会从两个方向被推高。

一个方向是模型能力。大模型在快速迭代，半年前模型做不好的事，现在可能已经能做了。今天「等模型进步」象限里的流程，下个季度可能就因为一个新模型移到了「优先做」。

另一个方向是基础设施 —— 也就是项目管理的例子。你不用等模型变强，自己先把数据结构化（搭一个钉钉 AI 表格这样的中间层），就能把可行性拉上来。这个方向往往被低估，因为它要的是工程投入，而不是被动等待。

所以这个评估不是一次性的。企业应该每季度重新评估一次，尤其是那些高 ROI 但当前技术可行性不足的流程 —— 要么等到了模型进步，要么自己补上了基础设施。

我在企业知识 AI Ready 的落地路径里提到过，知识基础设施的成熟度会直接影响流程 AI 化的可行性。企业的知识库越完善、结构化中间层越成熟，AI 能调用的上下文越丰富，技术可行性就越高。这意味着决策矩阵的两个轴并不独立 —— 技术可行性会随着企业知识 AI Ready 程度的提升而提升。

落地路径

分三步走：

第一步：流程盘点。 把现有业务流程按 ROI 和技术可行性打分，填入决策矩阵。重点关注高频、高人力投入、结构清晰的流程。

第二步：跑试点。 从「优先做」象限里选 1-2 个流程，跑通 AI 驱动的完整闭环。关键要验证人审核的比例和效率 —— 这直接决定真实 ROI。

第三步：逐步扩展。 试点跑通后把经验复制到其他流程。同时定期刷新「等模型进步」象限的评估，抓住技术成熟或基础设施补齐的时间窗口。

整个过程最值得追踪的指标是 人审核比例的变化趋势。从 100% 降到 50% 再到 10%，这个数字本身就是 AI 真正在创造价值的证据。如果人审核比例长期停在 80% 以上不降，说明流程的 AI 化程度不够深，需要重新评估技术可行性或调整流程设计。

你们企业在推进 AI 化时，哪个流程的人审核比例降得最快？欢迎留言讨论。