别再手动整理用户反馈了:把 VOC 变成一条自动化生产线

从原始用户声音到产品 Backlog,一套可落地的端到端自动化流水线设计教程

每家公司都说"以用户为中心",但 90% 的用户声音(Voice of Customer, VOC)最终的归宿是——躺在某个 Excel 表里,等着某个产品经理"有空的时候"去翻一翻。

问题不是团队不重视用户反馈。问题是:从原始反馈到可执行的产品动作之间,隔着太多手工活。 收集、清洗、分类、归因、优先级排序、写进 Backlog——每一步都在消耗人的精力,而人的精力是有限的。

这篇文章是一个完整的教程:如何用 AI + 自动化工具,把 VOC 变成一条可执行的生产线——从原始数据采集,到最终输出结构化的产品需求,全程自动。

[Read More]

别用同一把尺子量所有 Agent:按行业和岗位设计评测体系才是正经事

通用任务型 Agent 评测的核心矛盾——以及一套可落地的分层评测框架设计

上个月参加一个 Agent 产品的内部评审,产品经理拿出一张 benchmark 表格:准确率 92%、响应时间 1.2 秒、幻觉率 3%。数字很漂亮,领导很满意。

然后我问了一个问题:“这个 92% 的准确率,是在什么任务上测的?”

回答是一组通用 QA 数据集。

我又问:“你的目标用户是电商运营,你有没有用电商运营真实工作场景的任务来测?”

会议室安静了五秒钟。

这就是今天 Agent 评测的核心矛盾:我们在用"通用考试"的成绩来预测"专业岗位"的表现。 这就像用高考数学成绩来判断一个人能不能当好外科医生——逻辑上不成立,但大家都在这么干。

[Read More]

To B Agent 失败的根本原因:不是能力问题,是没有把 Agent 变成默认路径

从工具赋能到职责替代——为什么建议型 Agent 注定失败,以及电商场景的破局之道

回顾过去两年,无数 To B Agent 项目的墓碑上都刻着同一句话:“技术很好,但业务没用起来。”

技术团队困惑——模型能力明明够了,准确率也达标了,为什么运营就是不用?是培训不够?是界面不好?是 Prompt 没调好?

都不是。真正的原因是:你给了运营"用不用随便"的选择权。而只要有选择权,理性人就会选择不用。

[Read More]

别再卷模型了:To B Agent 创业,用户反馈才是生死线

模型训练已成系统工程,单点突破不再构成壁垒——能替代初级岗位的 Agent 产品,靠场景数据和反馈闭环赢得市场

2026 年,一个事实已经无法忽视:模型训练不再是一项研究活动,而是一项系统工程。

预训练需要万卡集群和 PB 级数据管线,强化学习需要奖励模型和 RLHF/DPO 的工程化流水线,推理优化涉及量化、蒸馏、speculative decoding 等一整套工具链,Agent 能力构建则横跨 function calling、长上下文、规划与工具使用的多维调优。任何一个方向的突破,如果不能在其他环节配合落地,就只是一篇论文,不是一个产品。

这意味着什么?模型本身正在变成标准化基础设施。 就像今天没有哪家 SaaS 公司拿"我们用了 PostgreSQL"当竞争优势一样,未来也不会有哪家 Agent 公司仅靠"我们微调了一个更好的模型"赢得市场。

那么 To B Agent 创业的制胜变量到底是什么?

[Read More]