企业业务流程 AI 化的决策框架

A Decision Framework for AI-Driven Business Processes

AI 时代企业 IT 变革的主要方向,是把业务流程优化成由 AI 来驱动,减少原有流程中人力的投入。但上个月,一个做企业数字化的朋友跟我说:他们花了大半年把内部流程都接上了 AI,看起来每个环节都有 AI 参与,人力成本却几乎没降。员工还是在填表、还是在审批、还是在做报表,AI 只是在旁边多了一个「建议」按钮。

我问他:你们到底是在让 AI 帮忙做,还是让 AI 来做?

这两件事有本质区别。前者是给现有流程加一个 AI 助手,人的角色不变,AI 只是辅助。后者是围绕 AI 重新设计流程,让 AI 成为主执行者,人从执行者变成审核者和判断者。

企业流程 AI 化决策框架:流程重构与双轴评估

大多数企业的数字化停留在前者,因为前者不需要改变组织结构和人的工作方式。但真正的效率跃迁只在后者发生。

人的角色,在 AI 流程里收敛成两件事

最简单的例子是报销。AI 从发票照片里提取金额、商户、日期自动填好表单,再按报销政策做预审 —— 金额在限额内、类别合规、不是重复提交,就自动通过;只有异常单据才标记出来给人看。人从「每张都审」变成「只看异常」,原来每步都要人的流程,现在人只剩两个动作:审核 AI 标出来的异常,判断 AI 拿不准的灰色地带。

但报销是最容易 AI 化的那一类 —— 输入结构化(就是一张发票)、单轮、规则可枚举、出错能改。真正能检验「让 AI 来做」这套逻辑的,是另一类流程:长程、跨部门、输入全是非结构化的聊天和文档。项目管理就是典型。

每家企业都有项目管理系统,但大多数系统需要 PM 手动更新进度、汇总状态、同步信息、调整资源。项目成员在钉钉群里讨论进展,PM 要从一周几百条聊天记录、几份会议纪要、十几个文档更新里提取关键信息,再手动录回系统。大量时间花在信息搬运上,真正用于决策的时间反而很少。

传统的项目管理流程:

PM 手动录入 → PM 手动更新进度 → PM 手动汇总状态 → PM 手动同步团队 → PM 手动调整资源

每个环节都是 PM 在操作,而且这个循环每周重复、跨越整个项目周期。这正是它比报销难的地方:报销是一锤子买卖,项目管理是持续数周、串联多个角色的长程任务。

AI 驱动的项目管理流程:

AI 自动解析项目文档 → AI 实时同步项目数据 → AI 生成状态报告 → AI 预警风险
         ↓                    ↓
   钉钉 AI 表格(中间层)    悟空 Agent(执行层)
         ↓                    ↓
   结构化数据存储           智能分析决策
         ↓                    ↓
         └─────────┬──────────┘
          项目持续优化 ← PM 审核和判断

这里的关键是 钉钉 AI 表格作为 AI Ready 的结构化数据中间层。它把非结构化的聊天记录、会议纪要、文档更新,转化成有明确字段的结构化项目数据:

from dataclasses import dataclass, field
from datetime import date


@dataclass
class TaskRecord:
    """钉钉 AI 表格里一条任务的结构化字段——把群聊和文档里散落的信息,收敛成机器可读的状态。"""

    task_id: str
    owner: str                            # 从 @ 提及和上下文里识别负责人
    status: str                           # 未开始 / 进行中 / 已完成 / 阻塞
    due_date: date
    last_update: str                      # 最近一次进展的原文摘要
    risk_flag: bool = False               # 悟空 Agent 预警的风险标记
    blockers: list[str] = field(default_factory=list)
# generated by hugo AI

有了这个结构化中间层,悟空 Agent 才能基于干净的数据做分析:自动提取进度更新、识别风险点、生成周报、推荐资源调整方案。钉钉群的协同能力让信息透明流动,团队成员直接在群里看到 AI 生成的状态报告和风险预警。

PM 在这个流程里也只做两件事:

审核 —— 看 AI 生成的状态报告和风险预警,确认是否准确。原来每天花 1-2 小时手动更新,现在大约 15 分钟审核 AI 的输出(基于我的项目经验估算)。

判断 —— 处理 AI 无法决策的复杂情况:项目优先级冲突、跨部门的资源协调、客户需求变更的影响评估。这些依赖经验和上下文,AI 给不出答案。

从「PM 做所有事」到「PM 只做审核和判断」,PM 的工作量可能降低 70%(基于我的项目经验估算)。注意这 70% 省的是信息搬运,省不掉的恰恰是最难的那部分判断 —— 这一点后面还会回来谈。这不是给 PM 加了一个 AI 助手,是整个项目管理流程围绕 AI 重新设计了。

收敛的本质:从执行者到决策者

报销和项目管理,一个简单一个复杂,但人的角色变化是同一个方向: 人在 AI 驱动的流程里,从执行者收敛成审核者和判断者。

审核是看 AI 的输出。AI 生成了周报,人看一遍有没有事实错误。AI 预审了报销单,人抽查异常。AI 起草了客户回复,人检查语气是否得体。

判断是处理 AI 搞不定的模糊地带。客户投诉里情绪特别激动的,AI 标出来转人工。两个候选人条件差不多,人选哪个。供应商交货延迟率突然升高,是季节性波动还是系统性问题。

这个收敛意味着组织设计要跟着变:

岗位重新定义。 原来十个人干活的团队,现在可能两个人加八个 AI Agent。但这两个人的能力要求变了 —— 不是手快,是眼光准,能看出 AI 没发现的异常。

异常处理变成核心能力。 正常流程 AI 跑,人专门处理 AI 搞不定的 edge case。这部分经验反而更值钱,因为它直接决定了 AI 能不能接管更多流程。

信任建立是个渐进过程。 还是拿项目管理说:刚上线时 PM 审核 100% 的 AI 输出,跑顺了降到 50%,再降到 10%。但降到多少合适,每个业务场景不一样,需要数据驱动而不是拍脑袋。

这里要正面回应一个最容易被忽略的反方: 如果人只剩下处理那 10% 的异常,省下的人力成本会不会被这 10% 吃掉? 毕竟异常恰恰是最难、最需要资深人力的部分。我的看法是:不会,但前提是异常比例真的能压到低位。AI 接管 90% 的常规流程后,资深的人从重复劳动里解放出来,专注在高价值的判断上 —— 单位异常的处理成本确实更高,但总量小到足以让整体人力大幅下降。反过来,如果异常比例压不下去(长期停在 30% 以上),那说明这个流程根本不该硬上 AI —— 这正是下面的决策框架要解决的问题。

不是所有流程都该 AI 化

识别出「人收敛到审核和判断」只是第一步。下一步是决定哪些流程先 AI 化、哪些该等等。我在 AI 时代的企业数字化 里提过三个支柱 —— 工作 Agent 化、知识 AI Ready 化、软件 CLI 化 —— 但知道方向之后,更具体的问题是:哪些流程先做?这需要一套评估方法。

第一个轴:ROI

AI 化一个流程能省多少钱?有五个因子要算:

因子怎么算容易忽略的点
人力成本节省现有工时 × 人均成本 × AI 替代比例审核人力还在,不是 100% 替代
错误率下降返工成本 × 改善幅度要对比 AI 新引入的错误和原有错误
速度提升周期缩短 × 时间价值真正的瓶颈往往不是流程慢,而是人没时间看
规模弹性业务量翻倍时成本是否线性增长AI 的边际成本很低,业务增长时利润结构显著改善
AI 运行成本模型调用 + 开发维护 + 人审核成本审核人力不能忘,可能占原来的 20-30%

最常见的坑是漏算审核人力。很多方案算 ROI 时假设 AI 替代了 100% 的人力,实际上人审核的成本可能还剩 20-30%。把这个成本漏掉,ROI 就虚高了 —— 这也是前面那个「省下的成本会不会被异常吃掉」反方的量化版本。

另一个容易被低估的是规模弹性。传统流程里业务量翻倍意味着人力翻倍,AI 流程里模型调用的边际成本很低,这意味着业务增长时利润率会显著改善。拿项目管理说,PM 能带的项目数量原来受手动工时上限约束,AI 接管信息搬运后,同一个 PM 能盯的项目数量可以成倍增长。但这个优势在业务量小的时候体现不出来,容易被忽略。

第二个轴:技术可行性

算清楚 ROI 之后,要评估技术上能不能做。五个维度:

维度高可行性低可行性
数据结构化程度表单字段明确大量非结构化输入(长邮件、语音、照片)
决策规则可枚举、有标准答案依赖经验直觉、模糊判断
容错空间错了能改回来错了不可逆(财务出账、法律文书)
上下文依赖单流程内闭环跨系统、跨部门串联
异常比例低于 5% 需要人介入频繁出现非标情况

数据结构化程度往往是第一道门槛。AI 处理结构化表单的能力已经很成熟,但涉及大量非结构化输入时准确率会显著下降。

容错空间决定了人审核的比例。内部周报写错了可以改,财务报表出错了可能要担法律责任。容错空间越小的流程,人审核的比例就越高,ROI 也就越低。

回到项目管理。按这五个维度打分,它一开始是个不折不扣的「难」案例:输入是非结构化的聊天和文档(数据结构化低)、要跨部门串联(上下文依赖高)。直接上 AI,准确率根本撑不起来。钉钉 AI 表格中间层做的事,本质就是把「数据结构化程度」这一维从低拉到高 —— 先把散落的信息收敛成结构化字段(就是前面那个 TaskRecord),悟空 Agent 才有干净的数据可处理。换句话说, 可行性不是流程的固有属性,而是可以靠基础设施改造的。 这一点决定了下面的决策矩阵不是一张静态的图。

决策矩阵

把两个轴交叉,得到一个简单的决策框架:

技术可行性
  高 ┃  ★ 优先做           │  ⚡ 快速试点
     ┃  ROI 高 + 能做       │  ROI 低但成本也低
  ───╋─────────────────────┼────────────────────
  低 ┃  🔭 等模型进步        │  ✗ 暂时不做
     ┃  ROI 高但做不了       │  ROI 低 + 做不了
     ┗━━━━━━━━━━━━━━━━━━━━━┻━━━━━━━━━━━━━━━━━━━
           高                     低
                        ROI

优先做 —— 高 ROI 加高可行性。比如报销预审、常规审批、日报生成。结构清晰、容错空间大、人力投入高,是最理想的切入点。

等模型进步 —— 高 ROI 但技术可行性低。比如合同审核、复杂财务分析。值得持续跟踪,因为模型能力在快速迭代。

快速试点 —— 低 ROI 但技术可行性高。虽然直接回报不高,但实施成本低,可以作为团队练手和基础设施验证的机会。

暂时不做 —— 低 ROI 加低可行性。不用浪费资源。

把前面的两个案例放进这个矩阵,能看出它其实是动态的。 报销 结构化、容错大、人力投入高,天生就在「优先做」象限,没什么悬念。 项目管理 才是有意思的那个 —— 在没有结构化中间层的时候,它 ROI 很高(PM 的人力消耗巨大)但技术可行性低,落在「等模型进步」象限;钉钉 AI 表格把数据结构化这一维拉上来之后,它整体右移、上移到了「优先做」。同一个流程,因为基础设施变了,在矩阵里换了象限。

关键一点:可行性不是固定的

项目管理换象限这件事,揭示了这个矩阵最容易被忽略的特性 —— 技术可行性不是固定的,它会从两个方向被推高。

一个方向是模型能力。大模型在快速迭代,半年前模型做不好的事,现在可能已经能做了。今天「等模型进步」象限里的流程,下个季度可能就因为一个新模型移到了「优先做」。

另一个方向是基础设施 —— 也就是项目管理的例子。你不用等模型变强,自己先把数据结构化(搭一个钉钉 AI 表格这样的中间层),就能把可行性拉上来。这个方向往往被低估,因为它要的是工程投入,而不是被动等待。

所以这个评估不是一次性的。企业应该每季度重新评估一次,尤其是那些高 ROI 但当前技术可行性不足的流程 —— 要么等到了模型进步,要么自己补上了基础设施。

我在 企业知识 AI Ready 的落地路径 里提到过,知识基础设施的成熟度会直接影响流程 AI 化的可行性。企业的知识库越完善、结构化中间层越成熟,AI 能调用的上下文越丰富,技术可行性就越高。这意味着决策矩阵的两个轴并不独立 —— 技术可行性会随着企业知识 AI Ready 程度的提升而提升。

落地路径

分三步走:

第一步:流程盘点。 把现有业务流程按 ROI 和技术可行性打分,填入决策矩阵。重点关注高频、高人力投入、结构清晰的流程。

第二步:跑试点。 从「优先做」象限里选 1-2 个流程,跑通 AI 驱动的完整闭环。关键要验证人审核的比例和效率 —— 这直接决定真实 ROI。

第三步:逐步扩展。 试点跑通后把经验复制到其他流程。同时定期刷新「等模型进步」象限的评估,抓住技术成熟或基础设施补齐的时间窗口。

整个过程最值得追踪的指标是 人审核比例的变化趋势。从 100% 降到 50% 再到 10%,这个数字本身就是 AI 真正在创造价值的证据。如果人审核比例长期停在 80% 以上不降,说明流程的 AI 化程度不够深,需要重新评估技术可行性或调整流程设计。

你们企业在推进 AI 化时,哪个流程的人审核比例降得最快?欢迎留言讨论。


See also