软件行业有一个永恒的矛盾:标准化产品满足不了个性化需求,定制开发又贵得离谱。每家企业都想要"适合自己的办公系统",但 SaaS 只能给你 80% 的功能,剩下 20% 要么忍着,要么花十倍的钱去定制。
钉钉的 CLI 化开放正在改变这个游戏规则。当钉钉的消息、日历、审批、文档、通讯录等能力都可以通过命令行接口被 AI Agent 直接调用时,一个新范式浮现了:过去需要写代码、做定制、走项目的办公需求,现在可以用自然语言描述,由 AI 用 Token 来交付。
从 API 到 CLI:一次质变
钉钉一直有 API,但 API 面向的是开发者。你要写代码、要调试、要部署、要维护——这些门槛把 99% 的办公需求挡在了门外。
CLI 化不一样。CLI 是 AI Agent 的母语。
# AI Agent 眼中的钉钉操作
dingtalk message send --to "张三" --text "周报已提交,请查收"
dingtalk calendar create --title "产品评审" --time "2026-03-25 14:00" --attendees "产品组"
dingtalk approval submit --template "请假申请" --reason "年假" --days 3
dingtalk doc search --keyword "Q1 OKR" --space "产品部"
# generated by hugo's coding agent
当这些操作变成标准化的命令行接口,AI Agent 就可以像人一样在钉钉里"办公"——收发消息、安排日程、提交审批、搜索文档、管理待办。不需要任何代码,不需要任何部署,只需要一条自然语言指令。
Skill:办公协同的最小可交付单元
在 AI Agent 的世界里,一个 Skill 就是一组能力的封装。比如"钉钉消息"这个 Skill:
# dingtalk-messaging skill
name: dingtalk-messaging
description: 收发钉钉消息、查看聊天记录、搜索联系人和会话
triggers:
- "发消息"
- "查消息"
- "聊天记录"
- "搜索联系人"
capabilities:
- 发送文本/富文本/卡片消息
- 查看最近会话和未读消息
- 搜索联系人和群组
- 读取聊天历史记录
# generated by hugo's coding agent
这个 Skill 不是一个需要安装的软件,不是一个需要配置的服务,它只是一段描述——告诉 AI Agent “你能做什么、怎么做、什么时候该做”。Agent 拿到这段描述,结合钉钉 CLI 的能力,就能在实际对话中自主完成任务。
这就是Token 交付的含义:你不再需要交付一个软件产品,你只需要交付一段 Prompt 和几个工具定义。
为什么 Skill 比定制软件更有想象力
1. 组合爆炸:1+1 远大于 2
单个 Skill 的价值有限。但当多个 Skill 组合在一起,想象空间呈指数级膨胀:
用户:帮我看看今天有哪些未读消息,如果有需要我审批的,直接帮我处理
Agent 内部执行链:
dingtalk-messaging → 获取未读消息
dingtalk-workspace → 检查待审批事项
dingtalk-workspace → 自动审批符合规则的申请
dingtalk-messaging → 回复发起人"已审批"
这个场景如果用传统方式实现,需要:前端界面设计、后端逻辑编写、审批规则引擎、消息通知系统、测试部署上线——一个小团队干一个月。
用 Skill?Agent 当场就能做。 而且下次你想改规则——“金额超过 5000 的不要自动审批”——只需要说一句话。
2. 个性化的边际成本趋近于零
传统办公软件的个性化困境:
| 需求 | 传统方式 | Token 交付方式 |
|---|---|---|
| “每周五下午自动汇总本周群消息要点” | 开发一个定时任务 + NLP 摘要服务 | 一条 Cron 指令 + 消息 Skill |
| “新人入职时自动拉入相关群并发送欢迎消息” | HR 系统对接 + 钉钉开放平台开发 | 一个 HR 事件触发的 Skill 组合 |
| “把审批流程里的关键节点同步到项目管理看板” | Webhook + 数据映射 + 前端展示 | Agent 实时监听 + 跨 Skill 联动 |
每一个个性化需求,在传统模式下都是一个"小项目"。在 Token 交付模式下,只是 Agent 的一次对话。
3. 自然语言即接口
最深刻的变化是:用户不再需要学习任何界面。
过去,每个办公工具都有自己的界面、自己的操作逻辑、自己的学习曲线。钉钉的审批怎么提?文档在哪里搜?日程怎么创建?每个功能都需要点来点去。
现在,所有操作都收敛到一个统一的入口——对话。你只需要说你想做什么,Agent 来替你操作。这不是"语音助手"那种浅层的语音转按钮,而是 Agent 真正理解你的意图,自主规划执行路径,调用多个工具协同完成任务。
一个真实的使用场景
我在 OpenClaw 中配置了钉钉消息和工作台的 Skill。一个典型的早晨是这样的:
我:早上好,帮我看看今天有什么要处理的
Agent:
早上好!我帮你整理了今天的待办:
📬 未读消息(3 条重要):
1. 产品组-李明:Q2 规划文档已更新,需要你 review
2. 技术部-王强:线上 P2 问题已修复,需要你确认
3. HR-赵敏:年度 360 评估截止今天
📋 待审批(2 条):
1. 张三的差旅报销 ¥3,200 — 符合标准
2. 李四的服务器采购 ¥45,000 — 超出部门预算
📅 今日日程:
- 10:00 产品周会(已准备好上周会议纪要)
- 14:00 技术评审(关联文档已打开)
- 16:00 1:1 与 CTO
建议:张三的报销可以直接审批,李四的采购需要你确认。
要我先处理报销审批吗?
这个交互背后,Agent 调用了消息查询、审批列表、日历读取、文档搜索四个 Skill。没有任何一个传统软件能在一个界面里做到这种程度的信息聚合和智能排序。
Token 交付的经济学
让我们算一笔账。
一个中等复杂度的办公定制需求(比如"自动汇总每日审批并发送日报"):
- 传统定制开发:2 个开发人员 × 2 周 = 约 ¥60,000
- 低代码平台:配置 + 调试 + 维护 ≈ ¥10,000/年
- Token 交付:Skill 定义 + Agent 每日执行 ≈ ¥0.5/天 × 365 = ¥182/年
而且 Token 交付的方案有一个传统方案做不到的优势:需求变更成本为零。老板说"加上周末的数据"?说一句话就行。“不要发给我了,发到群里”?再说一句话。
更大的图景:办公协同的 Skill 生态
当钉钉把自己的能力 CLI 化,它实际上在做一件更大的事:为 AI Agent 时代构建办公协同的 Skill 生态基础设施。
想象一下未来的场景:
- Skill 市场:开发者不再开发"钉钉应用",而是发布"办公 Skill"——一段精心编写的 Prompt + 工具定义,标价 ¥9.9/月
- Skill 组合器:用户可以像搭积木一样组合不同的 Skill——“消息摘要 + 待办提醒 + 审批助手"形成自己的个性化办公 Agent
- Skill 自进化:参照 OpenClaw 的 Skill 自优化机制,办公 Skill 可以根据你的使用习惯自我迭代——越用越懂你
这不是科幻。钉钉 CLI 化开放,加上 AI Agent 框架的成熟,所有技术组件都已就位。
软件的终局:从产品到技能
回看软件行业的发展历程:
大型机时代:软件 = 定制项目(百万级,按年交付)
↓
PC 时代:软件 = 套装产品(千元级,买断制)
↓
云时代:软件 = SaaS 服务(百元级/月,订阅制)
↓
AI 时代:软件 = Skill 技能(Token 级,按用交付)
每一次跃迁,交付的颗粒度都在变小,个性化的成本都在降低。到了 Skill 这一层,交付的已经不是一个"产品”,而是一种"能力"。这种能力可以被 Agent 随时调用、自由组合、动态适配——这才是真正意义上的"按需使用"。
钉钉的 CLI 化开放,正站在这个历史转折点上。当企业办公的核心能力都可以被 AI Agent 通过标准接口调用时,我们离"每个员工都有一个懂自己的 AI 助手"就只差最后一步了——那就是足够多、足够好的办公协同 Skill。
这片市场,太有想象力了。