Best-Practice

任何省 Token 的做法都不是大模型的最佳实践

Posted on February 25, 2026 | 2 min | 344 words

最近看到很多文章在教人如何"省 Token"——压缩 prompt、缩短上下文、用更小的模型替代、砍掉 system prompt……这些技巧看似精明，但我越来越确信一个观点：任何以省 Token 为目标的做法，都不是大模型的最佳实践。

这不是因为我不在乎成本。恰恰相反，正是因为我在乎投入产出比，所以我认为"省 Token"是一个错误的优化方向。