<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Production on All about Raspberry Pi</title><link>https://hugozhu.site/tags/production/</link><description>Recent content in Production on All about Raspberry Pi</description><generator>Hugo</generator><language>en</language><lastBuildDate>Tue, 19 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://hugozhu.site/tags/production/index.xml" rel="self" type="application/rss+xml"/><item><title>悟空技巧十四：AI Agent 生产环境调试与可观测性，当 AI 开始「胡说八道」时如何快速定位根因</title><link>https://hugozhu.site/post/2026/229-wukong-prompt-observability-and-debugging/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://hugozhu.site/post/2026/229-wukong-prompt-observability-and-debugging/</guid><description>&lt;p&gt;你的团队已经把悟空（或企业级 AI Agent）接入了核心业务流。&lt;/p&gt;
&lt;p&gt;上线第一周，一切顺利。第二周开始，客服团队反馈：「Agent 昨天给客户报了错误的价格，今天又把两个订单搞混了。」你打开日志，看到的是几千条 &lt;code&gt;200 OK&lt;/code&gt; 的 API 响应——传统监控告诉你系统「健康」，但业务侧已经出了事故。&lt;/p&gt;
&lt;p&gt;更痛苦的是调试过程：你无法复现问题，因为 Agent 的每次执行路径都不同；你找不到是哪一步出了问题，因为日志里只有输入和最终输出，中间的工具调用、推理链、状态变更全是一片黑盒。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;这不是 Bug，这是 AI Agent 的「非确定性」本质。&lt;/strong&gt; 传统软件的可观测性（APM、日志、指标）在 Agent 面前几乎失效。&lt;/p&gt;
&lt;p&gt;在前面的十三篇文章中，我们构建了从 &lt;a href="https://hugozhu.site/post/2026/211-wukong-prompt-clarification-technique/"&gt;需求澄清&lt;/a&gt;、&lt;a href="https://hugozhu.site/post/2026/224-wukong-prompt-multi-agent-orchestration/"&gt;多 Agent 编排&lt;/a&gt; 到 &lt;a href="https://hugozhu.site/post/2026/228-wukong-prompt-maturity-model/"&gt;成熟度模型&lt;/a&gt; 的完整体系。但当 Agent 真正跑在生产环境时，你会发现：&lt;strong&gt;没有可观测性，就没有可靠性。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;今天，我们推出系列的&lt;strong&gt;第十四篇&lt;/strong&gt;：&lt;strong&gt;如何为 AI Agent 构建生产级可观测性体系，实现从「黑盒盲猜」到「白盒定位」的调试范式转变。&lt;/strong&gt;&lt;/p&gt;</description></item></channel></rss>