<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Data-Engineering on All about Raspberry Pi</title><link>https://hugozhu.site/tags/data-engineering/</link><description>Recent content in Data-Engineering on All about Raspberry Pi</description><generator>Hugo</generator><language>en</language><lastBuildDate>Fri, 05 Jun 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://hugozhu.site/tags/data-engineering/index.xml" rel="self" type="application/rss+xml"/><item><title>从 SQL 生成器到数据工程范式转移：Anthropic 自助数据分析启示录</title><link>https://hugozhu.site/post/2026/258-anthropic-self-service-analytics-paradigm-shift/</link><pubDate>Fri, 05 Jun 2026 00:00:00 +0000</pubDate><guid>https://hugozhu.site/post/2026/258-anthropic-self-service-analytics-paradigm-shift/</guid><description>&lt;p&gt;上周，一个同事在悟空里问了一句「上周日活多少」，Agent 自信地返回了一个数字：精确到个位，格式漂亮，SQL 语法无懈可击。唯一的问题是——它用了一张已经废弃 3 个月的旧表。&lt;/p&gt;
&lt;p&gt;没有人发现这个错误。因为数字「看起来对」。&lt;/p&gt;
&lt;p&gt;这就是 Anthropic 在官方博客《&lt;a href="https://claude.com/blog/how-anthropic-enables-self-service-data-analytics-with-claude"&gt;How Anthropic Enables Self-Service Data Analytics with Claude&lt;/a&gt;》里描述的核心困境。我第一反应是「这不就是自然语言查数吗」。但读完全文，我发现自己错了——Anthropic 真正在做的，不是让业务人员用中文写 SQL，而是把整个数据工程的范式从「给人看」重构为「给 Agent 看」。&lt;/p&gt;
&lt;p&gt;&lt;a href="https://hugozhu.site/img/2026/anthropic-self-service-analytics-paradigm-shift.png"&gt;&lt;img src="https://hugozhu.site/img/2026/anthropic-self-service-analytics-paradigm-shift-thumb.jpg" alt="Anthropic 自助数据分析架构：从传统 BI 到 AI Native 的四层范式转移"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;Anthropic 原文里最刺痛我的一句话是：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;The initial elation of liberation from ad-hoc requests turns into dread with the realization that this setup separates stakeholders from the underlying infrastructure, documentation, and expertise that previously steered them toward carefully curated datasets.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;翻译成大白话：你刚把 Claude 接上数据仓库，业务方欢呼终于不用找你写 SQL 了；但很快你会发现，他们问出来的问题越来越离谱，因为 Agent 失去了原来数据团队通过文档、培训、代码审查建立的「认知护栏」。&lt;/p&gt;
&lt;p&gt;这不是技术问题，是 &lt;strong&gt;数据产品的用户变了&lt;/strong&gt;。&lt;/p&gt;</description></item></channel></rss>