上个月有人问我一个问题:「我已经有 LLM-as-Judge 做 eval 了,能不能用它来自动优化 Agent 的执行路径?在不降质量的前提下,找到最省钱的轨迹,然后让 Agent 记住?」
这个问题的答案值得展开。答案是能,而且这可能是当前 Agent 优化里最值得投入的方向。但大多数团队理解错了「优化」的对象。
[Read More]上个月有人问我一个问题:「我已经有 LLM-as-Judge 做 eval 了,能不能用它来自动优化 Agent 的执行路径?在不降质量的前提下,找到最省钱的轨迹,然后让 Agent 记住?」
这个问题的答案值得展开。答案是能,而且这可能是当前 Agent 优化里最值得投入的方向。但大多数团队理解错了「优化」的对象。
[Read More]