<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Llm-Agent on All about Raspberry Pi</title><link>https://hugozhu.site/tags/llm-agent/</link><description>Recent content in Llm-Agent on All about Raspberry Pi</description><generator>Hugo</generator><language>en</language><lastBuildDate>Fri, 08 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://hugozhu.site/tags/llm-agent/index.xml" rel="self" type="application/rss+xml"/><item><title>企业知识库新范式：从一亿预算到人在回路</title><link>https://hugozhu.site/post/2026/202-enterprise-knowledge-base-new-paradigm/</link><pubDate>Fri, 08 May 2026 00:00:00 +0000</pubDate><guid>https://hugozhu.site/post/2026/202-enterprise-knowledge-base-new-paradigm/</guid><description>&lt;p&gt;上周和一位创业者吃饭，他刚帮一家大型企业做完知识图谱项目的评估。结论让人倒吸一口凉气：要达到替代中级岗位能力的水平，算上数据采集、清洗、标注、图谱构建和持续维护，预算需要一个亿。&lt;/p&gt;
&lt;p&gt;企业听完直接搁置了。&lt;/p&gt;
&lt;p&gt;这不是个例。过去三年，我见过不下十个类似的项目——企业想做知识库，供应商画了一个「知识图谱+智能问答」的大饼，然后企业发现投入产出比根本算不过账。&lt;/p&gt;
&lt;p&gt;但今年情况变了。模型能力的跃迁正在催生一个新范式：&lt;strong&gt;不再靠人工标注堆数据，而是让 LLM 做编排，结合企业搜索，人做优化调整和确认。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;知识整理的起点也不再是宏大的「企业知识图谱」，而是每个人手边的 Journal——每日工作日记。通过钉钉这样的组织连接工具，个人知识可以自然地流转、沉淀为企业知识。&lt;/p&gt;</description></item><item><title>构建 Agent 的动态路由决策系统：千人千面的任务执行引擎</title><link>https://hugozhu.site/post/2026/201-dynamic-routing-decision-system-for-ai-agents/</link><pubDate>Fri, 08 May 2026 00:00:00 +0000</pubDate><guid>https://hugozhu.site/post/2026/201-dynamic-routing-decision-system-for-ai-agents/</guid><description>&lt;p&gt;团队里的小王和小李都在用同一个 AI Agent 平台。&lt;/p&gt;
&lt;p&gt;小王输入：「帮我总结一下今天群里的讨论。」&lt;/p&gt;
&lt;p&gt;Agent 调用了 fast/small 模型做意图识别，然后用 medium 模型读取了 200 条消息，生成了摘要。耗时 3 秒，花费 0.02 元。&lt;/p&gt;
&lt;p&gt;小李输入了完全相同的指令。&lt;/p&gt;
&lt;p&gt;Agent 却调用了 large/reasoning 模型，不仅做了摘要，还自动关联了小李上周的项目文档，识别出了三个待办事项，并推送到了他的日历。耗时 12 秒，花费 0.15 元。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;同样的输入，完全不同的执行路径。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;这不是 bug，而是一个成熟的 Agent 系统应该具备的能力——根据用户画像、历史行为、任务上下文，动态决策每一步该用什么模型、什么工具、注入多少上下文、以什么并发度执行。&lt;/p&gt;
&lt;p&gt;当你的 Agent 只有 100 个用户时，这些问题还不明显。你可以手动调几个规则，给 VIP 用户分配更好的模型，给普通用户限流。靠人肉运维，系统也能跑。&lt;/p&gt;
&lt;p&gt;但当用户量从 100 涨到 10 万、100 万，当模型供应商从 1 家变成 10 家，当工具调用从几个 API 扩展到上百个——&lt;strong&gt;靠人写规则来调度，系统会直接崩溃&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;不是因为规则写不出来，而是因为规则的组合空间是&lt;strong&gt;指数级&lt;/strong&gt;的：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;7 种任务类型 × 5 个复杂度等级 × 10 个模型 × 4 种用户画像 × 3 种上下文策略 = &lt;strong&gt;4,200 种路由组合&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;这还只是单节点决策。如果任务被分解为 3-5 个子节点，每个节点独立路由，组合数直接爆炸到 &lt;strong&gt;百万级&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;没有人能手动维护百万级的路由规则表。&lt;/p&gt;
&lt;p&gt;大多数 Agent 框架把执行路径写死在代码里：先调用 A 模型，再调用 B 工具，最后返回结果。这在 demo 阶段没问题，但一旦面向规模化用户，就会暴露三个致命问题：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;成本失控&lt;/strong&gt;——所有用户都用最强模型，简单任务也在烧钱，规模化后月账单直接六位数&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;体验一刀切&lt;/strong&gt;——新手和专家拿到相同的结果，没有人觉得「懂我」，留存率上不去&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;无法进化&lt;/strong&gt;——系统上线后不会从用户反馈中学习，规则越写越多，越用越僵化&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这篇文章，我们来拆解如何构建一个&lt;strong&gt;动态路由决策系统（Dynamic Routing Decision System, DRDS）&lt;/strong&gt;——一套端到端的自进化引擎，让 Agent 的执行路径真正做到千人千面，并且在规模化下持续学习、自动优化。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;核心观点：自进化不是 Agent 的「加分项」，而是规模化后的「必选项」。&lt;/strong&gt;&lt;/p&gt;</description></item><item><title>用 LLM Wiki + Obsidian 构建个人 AI 知识图谱</title><link>https://hugozhu.site/post/2026/198-llm-wiki-obsidian-knowledge-graph/</link><pubDate>Mon, 04 May 2026 00:00:00 +0000</pubDate><guid>https://hugozhu.site/post/2026/198-llm-wiki-obsidian-knowledge-graph/</guid><description>&lt;p&gt;去年年底，我做了一个实验：把过去十年写的 190 多篇博客、Obsidian 里的读书笔记、还有悟空 Agent 的实践记录，全部扔给 Hermes Agent，让它按照 Karpathy 的 LLM Wiki 模式自动整理。&lt;/p&gt;
&lt;p&gt;三天后，我打开 Obsidian 的 Graph View，看到了一个由 &lt;strong&gt;50 多个节点互相连接的知识网络&lt;/strong&gt; — 不是文件归档，而是一个真正的知识图谱。Agent 自动提取了实体和概念，建立了双向链接，甚至发现了我自己都没意识到的关联：&lt;code&gt;[[compression-as-intelligence]]&lt;/code&gt; 和 &lt;code&gt;[[agent-memory]]&lt;/code&gt; 之间有一条隐含的逻辑链，我自己写了三年都没发现。&lt;/p&gt;
&lt;p&gt;那一刻我意识到：&lt;strong&gt;个人知识管理的瓶颈不是工具，而是&amp;quot;碎片到结构&amp;quot;的转换成本。&lt;/strong&gt; 这篇文章，我把整个系统的架构、自动化流程和实际用法完整拆解出来。&lt;/p&gt;</description></item><item><title>上线 1 个月的桌面 Agent，路由架构应该怎么演进？</title><link>https://hugozhu.site/post/2026/190-desktop-agent-query-classification-routing/</link><pubDate>Sat, 25 Apr 2026 00:00:00 +0000</pubDate><guid>https://hugozhu.site/post/2026/190-desktop-agent-query-classification-routing/</guid><description>&lt;p&gt;上周三晚上 11 点，老王给我发消息：他们的桌面 Agent 上线刚满 30 天，DAU 爬到 8000，团队 4 个人。他翻了一周用户行为日志，发现一个反直觉的事实——&lt;strong&gt;用过 3 次以上的用户里，62% 只把它当&amp;quot;自然语言版的快捷启动器&amp;quot;用，真正让它做跨应用编排的不到 13%&lt;/strong&gt;。但他们的技术栈正按&amp;quot;复杂编排&amp;quot;在搭：每个 query 直接扔给 GPT-4o 做 function calling，P50 延迟 1.6 秒，P99 干到 3.8 秒。&lt;/p&gt;
&lt;p&gt;老王问：&amp;ldquo;我看了你之前那个四层意图漏斗，要不要现在就全套上？团队就 4 个人，老板说三个月内要把日活做到 5 万，怕 over-engineering。&amp;rdquo;&lt;/p&gt;
&lt;p&gt;我的答案：要上，但&lt;strong&gt;不是一次上四层&lt;/strong&gt;。1 个月的 Agent 团队最缺的不是模型层数，是&lt;strong&gt;能让你做对决策的数据&lt;/strong&gt;。&lt;/p&gt;</description></item><item><title>能做事的 Agent，需要一个推荐系统</title><link>https://hugozhu.site/post/2026/188-agent-task-recommendation-system/</link><pubDate>Thu, 23 Apr 2026 00:00:00 +0000</pubDate><guid>https://hugozhu.site/post/2026/188-agent-task-recommendation-system/</guid><description>&lt;p&gt;上周团队里的某同事给他的 AI Agent 加了一个&amp;quot;帮我总结这个网页&amp;quot;的功能。用户发一个 URL，Agent 自动打开、提取内容、生成摘要。听起来很简单对吧？&lt;/p&gt;
&lt;p&gt;结果上线第一天就翻车了。&lt;/p&gt;
&lt;p&gt;一个用户发了一个 GitHub 仓库链接，Agent 用浏览器沙箱打开了仓库首页，截取了 README 的前几屏，然后用一个 7B 的轻量模型生成了摘要——完全忽略了仓库里真正的核心代码和 issue 讨论。用户等了 40 秒，得到了一段废话。&lt;/p&gt;
&lt;p&gt;同一个功能，另一个用户发了一个新闻网站链接，这次 Agent 反而用了最强的推理模型去处理——一个纯文本提取任务，花了不必要的 token 费用，还因为推理模型的&amp;quot;过度思考&amp;quot;把简单的新闻摘要写成了一篇分析报告。&lt;/p&gt;
&lt;p&gt;某同事跑来找我：&amp;ldquo;模型能力明明够了，为什么用户体验这么差？&amp;rdquo;&lt;/p&gt;
&lt;p&gt;我说：&amp;ldquo;你的问题不是模型不行，是你没有给任务找到合适的模型和执行环境。你缺的是一个推荐系统。&amp;rdquo;&lt;/p&gt;</description></item></channel></rss>