悟空技巧五:迭代优化,用结构化反馈替代「重写」

Wukong Tip #5: Iterative Refinement with Structured Feedback

AI 第一次输出往往只有 70-80% 可用。

大多数人的本能反应是:「不对,重写」「再优化一下」

这种模糊反馈会导致两个致命问题:

  1. 全盘重生成:AI 会丢弃原本写对的部分,重新抽样,导致「好的没留住,坏的没修好」。
  2. 指令漂移:缺乏具体修改锚点,AI 只能靠猜测调整,越改越偏离预期。

在前面的四篇文章中,我们构建了从 需求澄清分步执行交付物定义示例对齐 的完整工作流。

今天,我们补齐最后一块拼图:当 AI 首次输出不完美时,如何通过「迭代优化」,用结构化反馈精准推到 100%,完成从「可用」到「完美」的最后一公里。

🎯 核心问题:为什么「重写」是效率杀手?

大语言模型(LLM)的生成具有随机性(Temperature)。当你对 AI 说「重写」时,模型会重新进行一次完整的抽样过程。

这意味着:

  • 原本正确的逻辑可能被改错。
  • 原本满意的措辞可能被替换。
  • 原本对齐的格式可能再次跑偏。

「重写」是推倒重来,而「迭代」是定向手术。

高效的 AI 协作,不是期待 AI 一次命中,而是通过小步快跑、定向纠偏,快速收敛到最优解。

🔧 核心理念:迭代优化(Iterative Refinement)

把「重写」变成「定向手术」。用结构化反馈框架精准锁定修改范围、原因和方向,让 AI 在已有基础上迭代,而非推倒重来。

标准 Prompt 模式

"整体方向不错,但需要针对以下部分进行定向修改:
1. 保留:[明确不需要改的部分,防止 AI 误伤]
2. 修改:[具体指出哪一段/哪一点/哪段代码有问题]
3. 原因:[为什么不好?逻辑漏洞?数据不准?语气太硬?缺少边界处理?]
4. 方向:[期望改成什么样?可结合技巧二/三给标准或示例]
5. 范围:[只修改上述部分,其他保持不变]

请基于以上反馈输出 v2 版本。"

🛠️ 实战案例

案例一:技术方案微调

❌ 模糊反馈

“太理论了,重写”

结果:AI 可能会把原本不错的架构选型部分也改掉,换成另一套同样理论化的方案。

✅ 结构化反馈

“整体架构选型部分很好,请保留。

需要修改:‘容灾方案’段落。 原因:缺少具体的 RTO/RPO 指标和切换流程,太笼统。 方向:补充主从切换的具体步骤(如 VIP 漂移、DNS 切换)和降级策略,参考技巧二的交付格式(列表 + 关键数据)。 范围:只修改容灾方案部分,其他保持不变。”

结果:AI 精准定位到问题段落进行增强,原有优质内容不受影响。

案例二:营销文案语气调整

❌ 模糊反馈

“语气不对,再改改”

结果:AI 可能会从「太硬」改成「太软」,或者加入一堆尴尬的网络用语。

✅ 结构化反馈

“保留核心卖点和价格信息。

需要修改:开头两段。 原因:语气偏硬,缺乏共情,像是在念说明书。 方向:改用’用户痛点场景+解决方案’结构,参考我上次发的示例邮件语气(技巧三),更亲切自然一些。 范围:其余段落保持原样。”

结果:AI 只调整了语气有问题的部分,整体文案结构稳定,修改效率极高。

案例三:代码 Bug 修复

❌ 模糊反馈

“代码有 bug,重写”

结果:AI 可能会重写整个函数,引入新的命名不一致或逻辑错误。

✅ 结构化反馈

“保留数据解析和主流程逻辑。

需要修改:validate_payload 函数。 原因:未处理空值(None)和类型不兼容异常,运行时报错。 方向:补充 try-except 和类型守卫(isinstance),添加错误日志记录。 范围:其他函数不要动。”

结果:AI 像打补丁一样精准修复 Bug,避免了「修好一个 Bug,引入三个新 Bug」的恶性循环。

🧠 为什么结构化反馈有效?

  1. 上下文锚定:LLM 对局部修改的遵循度远高于全局重写。明确「保留什么」能锁定优质上下文,防止随机性破坏已有成果。
  2. 梯度优化思维:类似机器学习中的 Learning Rate。小步定向调整比大步盲目跳跃更容易收敛到最优解。
  3. 降低 Token 浪费:只让 AI 重新生成问题片段,节省上下文窗口和计算资源,响应更快、更稳定。

🚀 进阶变体

变体一:自我审查(Self-Critique)

在交付前让 AI 先挑自己的刺,大幅减少人工反馈轮次。

“在输出最终版之前,请先以 [资深架构师/资深编辑/安全专家] 的视角,找出当前方案的 3 个潜在缺陷或风险点,并自行修复后输出 v2。”

原理:LLM 具备强大的自我评估能力。通过角色扮演激活其批判性思维,往往能发现人类容易忽略的盲点。

变体二:多方案择优(Multi-Variant)

当方向不确定时,让 AI 提供选项而非单点答案。

“请针对这个问题提供 3 种不同思路的方案(保守/平衡/激进),用表格对比各自的 trade-off、实施成本和适用场景。我选择后再深入展开。”

原理:利用 LLM 的发散能力生成多个候选解,人类负责决策收敛,实现人机优势互补。

变体三:版本对比(Diff-Style)

“请输出修改后的 v2 版本,并在末尾附上 v1 → v2 的变更摘要(改了哪里、为什么改),方便我快速 Review。”

原理:类似 Git 的 Diff 机制,让修改过程透明化,便于人类快速验证 AI 是否正确理解了指令。

🔄 五步法全景:AI 协作完整闭环

至此,我们完成了高效 AI 协作的五步法全景图。这五个技巧环环相扣,构成了一个完整的工程化方法论。

┌──────────────────────────────────────────────────────────────┐
│                   高效 AI 协作五步闭环                        │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  ① 提问澄清(Input)                                         │
│     AI 反问 → 锁定真实需求与边界条件                           │
│     ↓                                                        │
│  ④ 分步执行(Process)                                       │
│     拆解计划 → 确认步骤 → 逐步推进                             │
│     ↓                                                        │
│  ② 交付物先行(Output)                                      │
│     定义格式/结构/长度/禁忌 → 锁定交付标准                      │
│     ↓                                                        │
│  ③ 示例驱动(Style)                                         │
│     提供正反面 Few-shot → 对齐风格与质量基线                   │
│     ↓                                                        │
│  ⑤ 迭代优化(Iteration)                                     │
│     结构化反馈 / 自我审查 / 多方案择优 → 精准收敛至 100%        │
│                                                              │
└──────────────────────────────────────────────────────────────┘

五种技巧的工程类比

技巧解决维度核心动作工程类比
一:提问澄清InputAI 反问确认需求评审(PRD Review)
四:分步执行Process拆解+逐步执行敏捷迭代(Sprint Planning)
二:交付物先行Output定义验收标准测试用例(Acceptance Criteria)
三:示例驱动Style提供参考样例参考实现(Reference Impl)
五:迭代优化Iteration结构化反馈Code Review + Patch

🧠 本质思考:AI 协作是管理能力的延伸

很多人把 AI 当作「聊天机器人」,期待它像人类同事一样通过默契理解你的意图。但 AI 的本质是概率模型,它没有长期记忆中的「默契」,也没有对你个人偏好的隐性认知。

高效的 AI 协作,本质上是高效的项目管理。

  • 提问澄清 = 需求分析
  • 分步执行 = 敏捷规划
  • 交付物先行 = 验收标准
  • 示例驱动 = 参考实现
  • 迭代优化 = 代码审查与补丁

当你能清晰地定义需求、流程、标准和反馈时,AI 就能成为你最可靠的执行者。反之,如果你自己都没想清楚要什么,AI 只会放大你的模糊,生成一堆看似正确但毫无用处的内容。

AI 一直都很聪明,只是你需要学会如何给它下达可执行的指令。


你在实际使用悟空或其他 AI 工具时,有哪些「迭代优化」的成功案例?或者有哪些场景你觉得反馈特别难给?欢迎留言讨论。


See also