#001 5/25–5/31 5 月 31 日发布

AI 工程的范式跃迁：从提示到驾驭

本期拾遗聚焦 AI 工程正在发生的深层蜕变——我们不再只是编写更巧妙的提示，而是为模型构建持续进化的运行环境。从 Anthropic 的圆桌到一线 CTO 的实践都在指向同一个方向：Harness Engineering 的重要性正在超越模型本身。Claude 的隐藏功能、CLAUDE.md 的配置哲学、动态工作流的编排能力，正在重新定义“人机协作”的边界。与此同时，ClickHouse 面向 Agent 的数据技能与可观测性更新，也让我们看到基础设施层如何拥抱 AI 原语。本期精选 37 篇文章，划分为四个篇章：思维重塑、Claude 实战、Agent 工程化与数据前沿，希望能帮你跨越从“用 AI”到“建系统”的鸿沟。

38 篇 5 章约 9 小时

章节 01

思维重塑：从提示到驾驭的范式转移

10 / 38

x.com · 19 min

为什么你的“AI 优先”战略可能错了Why Your “AI-First” Strategy Is Probably Wrong

本文作者是平台公司 CTO，亲身实践将整个工程流程重构为 AI 原生：99% 生产代码由 AI 生成，一天内完成从想法到上线的迭代。文章批判了仅添加 AI 工具的“AI 辅助”模式，提出“驾驭工程”概念，详细拆解了技术栈、自愈反馈循环、新工程角色（架构师与操作员），并给出 3–8 次日部署的真实数据。适合正在思考如何真正将 AI 融入研发流程的工程团队和技术决策者。

x.com · 14 min

字节TRAE AI编程手册精读：上下文是护城河ByteDance TRAE AI Coding Manuals: Context Engineering as Moat

字节跳动TRAE团队20篇AI编程实践手册的精要总结。核心论点是AI编程的效率瓶颈不在模型能力，而在上下文工程。文章详细介绍了六大方法论：Context Engineering、Skills、Spec Coding、Rules、MCP和Agentic Coding，并提供了大量实验数据（如32个真实Bug修复：有Skills加持成交率100%，无Skills仅59%）。适合一线开发者、Tech Lead和工程管理者阅读。

www.akashbajwa.co · 12 min

Anthropic 圆桌：软件工程的未来The Future Of Software Engineering with Anthropic

本文总结了一场 Anthropic 组织的软件工程未来圆桌讨论，汇集 Stripe、NVIDIA、微软等公司工程领袖的洞察。讨论重点包括：闭环开发带来复利效应，测试先行成为默认实践，人工代码审查逐渐退场，注释开始为 AI 可读性而写。长周期自主代理任务仍是前沿难题，开发者工具最先被替代，而企业软件更具粘性。招聘更看重实验精神而非原始技能，上下文管理仍待解决，人类编写的上下文优于代理生成的。文章提供了来自一线实践的具体案例和真实权衡。

x.com · 12 min

编码代理如何重塑工程、产品与设计How Coding Agents Are Reshaping Engineering, Product and Design

编码智能体（coding agents）正在颠覆传统的工程-产品-设计（EPD）协作模式。过去，产品需求文档（PRD）是构建软件的起点，设计据此制作原型，再由工程实现。如今，编码智能体让任何人都能快速生成代码，导致实现成本骤降，瓶颈从实现转向评审。传统PRD已死，但描述产品意图的文档仍不可或缺，甚至可能演变为结构化的提示词（prompts）。这种变化对角色产生深远影响：通才价值飙升，因为一个人借助智能体就能快速构建原型；精益求精的系统思维成为核心技能；人人都需要产品感来决定构建什么；专业化的门槛提高，角色边界模糊，从业者要么成为自主构建者，要么成为深度评审者。最终，无论产品、设计还是工程背景，能深刻理解产品与技术的人将成为最大受益者。

www.bassimeledath.com · 22 min

Agentic 工程的八个层级：从自动补全到自治团队The 8 Levels of Agentic Engineering

Bassim Eledath 将 AI 辅助编程的实践演进分为八个层级：从最早的 Tab 补全和 AI IDE，到上下文工程、复合工程、MCP/技能、反馈循环、后台代理，最终走向自治代理团队。他强调每一层都必须建立在前一层的基础上——混乱的上下文、缺失的约束或不合适的工具会让高级阶段放大混乱。文章分享了多个实战案例（如共享 PR 审查技能、多模型派发系统），并提出了计划模式正在消亡、实施与审查必须分离等尖锐观点，是为工程团队提升 AI 生产力提供的务实路线图。

articles.zimetic.com · 8 min

超越编码助手：企业级 AI 辅助软件工程系列开篇Beyond the Coding Assistant — A New Series

本免费系列探讨 AI 辅助软件工程在企业规模下的真实面貌：个体编码效率大幅提升，但许多团队交付速度并未同步，甚至下降。作者指出当前 AI 编码助手仅优化单一角色，而软件交付需全员参与，主张未来应关注生命周期编排而非单纯生成代码。系列分四部分，涵盖现状分析、问题重构、设计原则与展望，每周一三五更新，无付费墙。适合工程领导者、架构师和对 AI 工程化感兴趣的开发者。

www.koshyjohn.com · 11 min

工程思维的分水岭：你是在用 AI 提升层次，还是外包思考？A.I. Should Elevate Your Thinking, Not Replace It

软件工程界正分裂为两类人：一类用AI移除苦差、加速并专注于更高层次的工作（定义问题、权衡取舍、发现风险）；另一类用AI避免思考，将AI生成的输出当作自己的成果。作者将这种现象称为“外包思维”，它是一种新的失败模式，看似高效，实则侵蚀判断力。文章通过类比说明，跳过技能培养最终会导致能力空心化。真正有价值的工程师不是代码产量最高，而是能发现隐藏约束、分解模糊问题、创造清晰见解。领导层也面临同样考验：能否区分表面流利与真实技术深度，直接决定组织健康。本文适合所有软件工程师和工程管理者，引发关于AI时代职业发展的深度反思。

x.com · 3 min

从 Prompt 到 Context 再到 Harness：AI 工程的三次范式转移Prompt → Context → Harness: The Three Paradigms of AI Engineering

文章梳理了AI工程从Prompt Engineering (2023-2024)、Context Engineering (2025) 到Harness Engineering (2026初) 的三代范式转移。Harness Engineering 包含评估闭环、架构约束、记忆治理三层，分别由 Anthropic 和 OpenAI 的实操验证：Anthropic 的评估器 Agent 使 20 分钟产出不可用变为 6 小时产出完整游戏；OpenAI 五个月零手写构建百万行代码生产系统，依赖分层架构和 CI/linter 强制约束。两篇学术论文填补记忆层空白：(S)AGE 记忆系统通过拜占庭容错的 Proof of Experience 共识实现可信共享记忆，使 Agent 校准精度翻倍；纵向学习实验表明 3 行 prompt 加记忆与 200 行专家 prompt 性能持平，但前者随轮次显著提升。适合构建多 Agent 系统的工程师阅读。

x.com · 12 min

上下文工程正在替代提示工程：五层框架与实践指南Context Engineering Is Replacing Prompt Engineering. Here's How It Works

本文提出「上下文工程」正在取代提示工程：随着模型理解力提升，瓶颈不再是提示词本身，而是模型可用的上下文信息。作者给出五层框架：身份上下文（告诉 Claude 你是谁）、知识上下文（上传关键文档）、记忆上下文（持续记录偏好）、工具上下文（接入邮件、日历、代码库等 MCP 工具）、流程上下文（用 Skill 文件固化工作流）。核心观点：精心设计的环境比精心编写的 prompt 更重要。文章偏实操指南，无实测数据，适合重度使用 Claude 的用户。

x.com · 17 min

2026年AI必知20个核心概念：从神经网络到扩散模型20 AI Concepts You Must Understand in 2026

一篇入门级概览，用简笔画和类比分四部分解释20个现代AI核心概念：基础机制（神经网络、注意力）、LLM运作方式（Token化、幻觉）、模型改进方法（LoRA、RLHF）、实际系统构建（RAG、Agent）。无代码、无实现细节，适合需要快速建立基本认知的工程师。

章节 02

精通 Claude：配置、技巧与工作环境搭建

8 / 38

x.com · 10 min

Claude 实战指南：18 个步骤解锁全部潜力How to Actually Use Claude. 18 steps that unlock 100% of its potential

这篇指南通过 18 个具体步骤，系统讲解如何深度使用 Claude。内容涵盖：用 Projects 和 Custom Instructions 建立持久上下文，摆脱每次重复解释自己；转变使用思维，将 Claude 视为思考伙伴而非搜索引擎；高级技巧如风格克隆、延伸思考、节省 Token 的指令；以及即用型提示模板（费曼学习法、旅行规划、财务分析、商业点子压力测试）。关键数据：指定输出长度一条指令即可减少 40-60% Token 消耗。适合所有希望突破基础问答、让 Claude 真正适配自己工作流的日常用户。

x.com · 11 min

Claude 隐藏功能全指南：17 个你不知道的用法Claude Can Do All of This. Most People Have No Idea.

本文详细介绍了 Claude 的 17 个隐藏功能，涵盖持久记忆（Projects）、聊天内构建可交互应用（Artifacts）、深度推理模式（Adaptive Thinking）、长期个人画像（Memory）、角色扮演提示词、浏览器代理（Claude in Chrome）、桌面文件系统访问（Cowork）、定时任务、技能插件、CLAUDE.md 项目规则、终端编码与调试（Claude Code）、可视化设计工具（Claude Design）以及 API 调用成本降低 90% 的提示缓存。每个功能附有开启位置和即用提示词，适合想实操上手 Claude 的工程师和效率控。

spin.atomicobject.com · 7 min

你的最佳提示就是一份定义清晰的用户故事Your Best Prompt Is a Well-Defined User Story

在代理式开发时代，用户故事的质量直接影响 AI 产出。文章主张团队应把更多时间花在拆解故事和编写清晰的验收标准上，而非仅仅估算故事点。一个清晰的故事应包含三部分：背景、验收标准和技术假设。故事点估算仅当需要发布预测或发现团队认知差异时才有价值，否则可省去。好的故事就是好的提示，能显著加速开发周期。适用于采用敏捷 / Scrum 的工程团队。

x.com · 2 min

卡帕西三句话，说破每个Claude Code用户的痛点Andrej Karpathy wrote something that every Claude Code user has felt b

安德烈·卡帕西对LLM行为的三点观察——静默假设、过度复杂化代码、粗心副效应——催生了一个单一的CLAUDE.md文件，内含四个原则：编码前先思考、简单至上、手术式修改、目标驱动执行。每条原则直指一个痛点。文件可直接放入任何项目，约束AI编程助手输出更严谨的代码。所有Claude Code用户都有同感，却难以言说。

x.com · 9 min

我把Claude调教成工作系统：25个实用配置How I set up Claude to actually get work done

多数人用Claude只是单次问答，不保存上下文。作者分享了一套系统化配置方法：设置个人指令、分项目、上传参考文件、创建上下文文件、连接邮件日历、构建模板与工作流等，把Claude从聊天窗口变成可复用的工作环境。全文25个具体步骤，适合所有觉得AI助手回答随机、缺乏连贯性的技术工作者。

x.com · 10 min

让 Claude Code 自动修复自身错误的完整配置How to Make Claude Code Fix Its Own Mistakes Automatically (Exact Setup You Can Copy)

本文详细介绍了如何配置 Claude Code（Anthropic 的 AI 编码辅助工具）使其自动发现、修复并记住自身错误，从而打破人工干预的循环。核心方法包括：维护一份持续增长的 CLAUDE.md 文件记录项目级规则和已犯错误；利用 PostToolUse 钩子在每次写入文件后自动格式化、类型检查并修复；使用 Stop 钩子在 Claude 声称完成时自动运行测试，失败则继续修复；通过 PreToolUse 钩子阻止危险操作（如写入 .env）；结合跨会话记忆机制。文章提供了可直接复制的 settings.json 完整配置，并对比了使用前后（每个功能从 45 分钟手动往返降至 10 分钟无人值守）。适用读者：使用 Claude Code 的工程师、AI 辅助编程用户。

x.com · 15 min

用 CLAUDE.md 为 Claude 装上永久记忆：21 条配置指令指南CLAUDE.md Guide: 21 Instructions to Lock In Preferences and Context

大多数人使用Claude时不知道CLAUDE.md的存在——这个文件放在项目根目录，会话启动时自动读取，能永久固化你的偏好、上下文与行为规则。本文提供21条具体指令，分五部分：沟通风格（禁止寒暄、坦诚不确定性、按需匹配篇幅）、行为规范（大改前先请示、只改被要求的部分、事后总结变更）、用户上下文（角色背景、项目目标、写作风格）、记忆与连续性（用MEMORY.md记录决策、会话摘要、记录失败尝试）、以及面向开发者的7条规则，包括Andrej Karpathy的4条黄金法则（不要假设、用最简单方案、不改无关代码、明确标出不确定性），据称将编码准确率从65%提升至94%。适用所有想减少重复解释、提升Claude输出一致性的用户。

x.com · 16 min

Claude 100% 使用指南：大部分人只用到了 10%How to Use Claude at 100% — Most People Never Get Past 10%

本文是一份完整的 Claude 使用指南，揭秘了 17 个大多数用户从未尝试过的隐藏功能，包括 Projects（项目）、Artifacts（构件）、Extended Thinking（扩展思考）、Memory（记忆）、Claude in Chrome（浏览器插件）、Cowork（桌面应用）、Scheduled Tasks（定时任务）、Skills（技能）、CLAUDE.md（自动规则文件）、Claude Code（终端编码）、Claude Design（视觉设计）以及 Prompt Caching（提示缓存）等。每个功能都配有具体的位置说明、开启方法和即用提示词。适合希望将 Claude 从聊天工具升级为生产力系统的用户。

章节 03

Agent 工程化：从代码生成到自主系统

15 / 38

claude.com · 12 min

HTML 的超常效力：用 Claude Code 摆脱 MarkdownUsing Claude Code: The unreasonable effectiveness of HTML

Thariq Shihipar 分享了他用 Claude Code 生成 HTML 而非 Markdown 的实践。HTML 能表达表格、SVG、设计、交互，信息密度远超 Markdown；生成的文档更易读、分享，支持双向交互和自定义编辑界面。Claude Code 可结合代码库、Slack、git 历史等上下文，生成富含图表和代码片段的 HTML 报告、原型或审查界面。文章给出具体用例：从方案探索、代码审查、设计原型到定制编辑工具，并提供可复用的提示词模板。适合希望提升 Claude Code 输出可读性、交互性的开发者。

claude.com · 19 min

Claude Code 在大代码库中的工作方式：最佳实践与入门指南Claude Code in Large Codebases: Best Practices and Getting Started

本文介绍 Claude Code 在百万行级单体仓库、遗留系统及多仓库架构中的实际部署经验。核心观点：Claude Code 采用代理搜索（Agentic Search）而非 RAG 索引，避免了索引过期问题，但性能高度依赖代码库上下文配置。文章详细拆解了围绕模型的“扩展层”（Harness），包括 CLAUDE.md、Hooks、Skills、Plugins、MCP 服务器和 LSP 集成等组件，并给出了三个配置模式（使代码库可导航、随模型演进维护配置、分配管理责任）。适合正在或计划采用 Claude Code 的大型工程团队阅读。

x.com · 10 min

从 0 开始：用 Hooks 打造自动化 Claude Code 工作流From Scratch: Build Automated Claude Code Workflows with Hooks

本文介绍如何用 Claude Code Hooks 在生命周期节点自动执行 shell 命令，以替代依赖 prompt 的不可靠行为。涵盖 PostToolUse、PreToolUse 等 5 个关键事件，3 种 Hook 类型 (command/prompt/agent)，及配置文件结构。提供 5 个即用 Hook 示例：桌面通知、自动格式化、文件保护、压缩后上下文恢复、commit 规范。退出码 2 可阻止危险操作并将 stderr 反馈给 Claude。适合希望让 Claude Code 工作流更稳定可靠的开发者。

claude.com · 6 min

Claude Managed Agents 推出「梦境」、成果评估与多智能体编排Dreaming, Outcomes, and Multiagent Orchestration in Claude Managed Agents

Anthropic 在 Claude 托管代理中引入了「梦境」功能（研究预览），可跨会话审视记忆、提取模式并自我改进。同时推出成果评估（定义成功标准，由独立评估器评分，自动修正直至达标）和多智能体编排（主代理拆解任务，子代理并行处理）。文章提供了内部测试数据：成果评估在困难任务上提升 10 个百分点，docx/pptx 生成质量分别提升 8.4% 和 10.1%；并展示了 Harvey（法律工作完成率提升 6 倍）、Netflix（并行分析构建日志）、Spiral（用成果评估控制写作质量）、Wisedocs（文档审查提速 50%）等案例。适合关注 AI 代理自动化、质量控制和复杂任务分解的一线工程师。

x.com · 13 min

5 种 ADK 开发者必备的 Agent Skill 设计模式5 Agent Skill Design Patterns Every ADK Developer Should Know

当前超过 30 种代理工具已统一 SKILL.md 格式，真正挑战转向内容设计。本文作者从 Anthropic、Vercel 和 Google 内部指南中总结出 5 种可复用设计模式：Tool Wrapper（按需加载库规范）、Generator（模板填空确保输出一致）、Reviewer（检查清单评分，按严重性归类）、Inversion（代理先采访用户再行动）、Pipeline（带门控条件的多步工作流）。每种模式均给出 ADK 可运行代码，适合需要构建可靠 AI Agent 的开发者参考。

x.com · 20 min

构建生产级AI智能体的十条工程原则how to build a production grade ai agent

超过40%的AI智能体项目因风险控制、架构和业务价值不清晰而失败，而非模型本身。本文从一线工程视角提出十条原则：从威胁建模、严格类型化工具契约、最小权限执行、上下文压缩、受控知识检索、确定性编排、记忆架构分离、可靠性机制到完整可观测性与持续治理。每条原则给出具体实现细节和真实案例（如Prompt注入在73%部署中出现），帮助工程团队将原型推向安全、可扩展的生产环境。

danielabaron.me · 12 min

用AI安全网重构CSS：零视觉变化的七阶段计划CSS Refactoring with an AI Safety Net

作者将一团乱麻的CSS用AI辅助重构，分7个阶段，全程保持视觉效果不变。借助Playwright自动截图9个应用状态，每个阶段后用Claude Code对比截图，自动发现任何视觉差异（如行高变化）。重构后CSS采用@layer层级、现代重置、统一按钮基类和CSS变量，整个流程耗时约3小时。文章详细介绍了枚举状态、编写脚本、用AI读图对比的经验，并讨论了为何选择AI而非专用视觉回归工具。适合前端开发者学习如何安全重构遗留样式。

tw93.fun · 20 min

拆解 Claude Code：六层架构、治理与工程实践Deconstructing Claude Code: Architecture, Governance, and Engineering Practices

作者基于半年深度使用 Claude Code 的实际踩坑，将 Claude Code 的功能拆解为六层（长期上下文、工具/MCP、Skills、Hooks、Subagents、Verifiers），并分别给出设计原则、反模式与配置示例。文章重点讨论了上下文工程（上下文成本构成、分层加载策略、压缩机制陷阱）、工具设计（如何让 Claude 少选错）、Hooks 的强制拦截场景、Subagents 的上下文隔离价值，以及 Prompt 缓存和验证闭环。最后给出项目级 CLAUDE.md 模板、混合语言项目 Hooks 实践与配置健康检查工具。适合希望将 Claude Code 从“ChatBot”升级为“可控工程 Agent”的一线工程师。

tw93.fun · 31 min

Agent 架构、工程实践与落地：从原则到 OpenClawAgent Unveiled: Principles, Architecture, and Engineering Practices

本文系统梳理了 Agent 系统的底层架构与工程实践，从稳定的 Agent Loop 控制流出发，对比 Workflow 与 Agent 的根本区别，解析五种常见控制模式及选型。重点强调 Harness（验收基线、执行边界、反馈信号、回退手段）比模型本身更决定系统收敛；上下文工程通过分层（常驻、按需、运行时、记忆、系统层）和三种压缩策略防止 Context Rot；工具设计遵循 ACI 原则，面向目标、参数防错、错误可修正；记忆系统分为工作、程序性、情景、语义四类，并通过整合与可回退机制实现跨会话一致性。还涵盖长任务跨 session 续跑、多 Agent 协议化协作、评测体系构建（Pass@k 与 Pass^k）以及基于事件流的可观测性。文章最终以 OpenClaw 的实现演示这些原则如何落地，适合需要构建稳健 Agent 系统的一线开发者。

vercel.com · 6 min

Vercel 发布 React 最佳实践仓库，面向 AI 编程代理优化Introducing React Best Practices: A Structured Repo for AI Agents

Vercel 将 10+ 年 React 与 Next.js 优化经验沉淀为 react-best-practices 仓库，包含 8 大类 40+ 规则，按影响度排序（从消除异步瀑布到 JavaScript 微优化）。每条规则配影响评级和代码修复示例，并生成 AGENTS.md 供 AI 代理查询。适用：需要系统化前端性能优化的团队与将 LLM 用于代码审查的工程师。

x.com · 5 min

用 Karpathy 的 autoresearch 方法，将你的 Claude Skills 效果提升10倍10x Your Claude Skills with Karpathy's Autoresearch Method

本文介绍如何用 Andrej Karpathy 的 autoresearch 方法自动迭代优化 Claude Skills。核心思路：给 agent 一份可打分的是/否 checklist，让它反复测试、改进你的 skill，每次判断改动是否有效。作者以落地页文案 skill 为例，通过4轮自动循环，质量检查通过率从56%提升至92%，并详细记录了每一轮改动及其理由。该方法适用于任何可量化评价的任务（如网站性能、开发邮件、文章开头），只需定义好评分标准。文章提供了可直接运行的 skill 下载，适合已搭建 AI 工作流但苦于质量不稳定的工程师实践参考。

x.com · 19 min

Claude Code Dynamic Workflows：把编排逻辑搬进代码的新原语Claude Code Dynamic Workflows: A New Primitive That Moves Orchestration Into Code

Anthropic 发布 Dynamic Workflows，一种将大规模任务编排写成 JavaScript 脚本、交由独立运行时执行的原语。脚本持有循环、分支和中间结果，主 Claude 上下文仅接收最终答案，解决了 subagent 和 Agent Teams 面临的上百个并行任务时上下文溢出与注意力稀释的瓶颈。文章详解架构、原语与执行模型，并以 Bun 迁移 Rust（11 天/75 万行/99.8% 测试通过）和个人 133 会话分析案例展示效果。对比 n8n/Coze/Dify 后指出，Workflow 是“确定性脚本 + 节点调 LLM”，图灵完备的代码表达力优于可视化 DAG，且编排可由模型现场生成。适用代码库级排查、大迁移、对抗验证等场景，但 token 消耗高、有并发与恢复等限制。适合需要大规模自动化编码任务的工程师。

claude.com · 7 min

Claude Code 推出动态工作流：端到端跑完大型任务，自动并行调度与校验Introducing dynamic workflows in Claude Code

Claude Code 新增动态工作流能力，允许单会话内动态生成编排脚本，并行启动数十到数百个子代理，自动拆解任务、交叉验证结果，端到端完成大型工程任务。典型场景包括代码库级 Bug 排查、大规模迁移、安全审计等。Bun 团队用此功能 11 天将 Bun 从 Zig 迁移至 Rust，生成约 75 万行代码，已有 99.8% 测试通过。工作流会在执行前展示计划并请求确认，任务中断后可接续执行，但 token 消耗显著高于普通会话。适用：希望用 Claude Code 处理大型、复杂任务的开发者，目前面向 Max、Team、Enterprise 用户。

blog.cloudflare.com · 18 min

Glasswing 项目：Mythos 的安全漏洞挖掘实战与启示Project Glasswing: What Mythos Showed Us

Cloudflare 在 Project Glasswing 中深度试用 Anthropic 的 Mythos Preview 模型，对其 50 多个自有仓库进行了安全扫描。该模型的核心进步在于能自动将多个低危漏洞串联成完整利用链，并生成可执行的 PoC，使漏洞验证从猜测变为可操作。实际使用暴露出模型拒绝不一致、信噪比等问题，单一通用 coding agent 效果不佳。Cloudflare 构建了包含侦察、狩猎、验证、补缺、去重、追踪、反馈和报告的八阶段编排框架，用并行窄域任务和对抗性复核大幅提升质量。文章最后指出，仅加快修补不够，需从架构上限制漏洞可达性，并预告后续面向客户的实践分享。

claude.com · 59 min

Claude Computer Use 工程落地指南：缩放、缓存与思考Best Practices for Computer and Browser Use with Claude

Anthropic 发布 Claude Computer Use 工程化落地指南，基于 4.6/4.7 系列模型的内部实测，系统覆盖截图缩放与点击精度、缓存断点布局与滚动缓冲区、服务端自动摘要、思维努力调优、提示注入防御，以及批量工具、顾问模式等实验特性。文中给出大量可运行的代码片段、具体参数阈值与调试方法，适合正在构建长链路桌面/浏览器自动化产品的工程师。

章节 04

数据与基础设施前沿

4 / 38

clickhouse.com · 3 min

ClickHouse 发布 Agent Skills：28 条规则让 AI 助手学会 ClickHouseIntroducing ClickHouse Agent Skills

ClickHouse 发布了官方 Agent Skills，一套开源的最佳实践规则集，基于 Anthropic 的 Agent Skills 规范打包了 28 条经工程师和社区验证的 ClickHouse 实操规则，涵盖 Schema 设计、查询优化和数据摄入。执行 npx skills add clickhouse/agent-skills 即可添加到本地环境，AI 助手（如 Claude Code）会自动在需要时调用这些规则，避免常见错误（如错误的 ORDER BY、不可扩展的 JOIN、遗漏物化视图）。仓库使用 Apache 2.0 许可，欢迎社区贡献经验。

www.infoq.cn · 18 min

从 OTel 到 Rotel：每秒处理量提升 4 倍的 PB 级追踪系统From OTel to Rotel: 4x Throughput Increase in PB-Scale Tracing

本文对比了 OpenTelemetry Collector 与 Rotel 在向 ClickHouse 写入追踪数据时的性能。在相同 8 核主机上，Rotel 实现每秒 370 万 trace span 的吞吐量（每核 46.25 万），是 OTel Collector 的 4 倍以上。性能提升源于三项关键优化：RowBinary 格式下的 JSON 列二进制编码，降低序列化开销；将反序列化迁移至共享线程池，消除 Tokio 任务阻塞及 glibc 内存分配器锁争用；启用快速 LZ4 压缩。测试还揭示了 OTel Collector 在反压下静默丢数据的缺陷。适合大规模可观测性数据管道的架构师与 SRE 参考。

clickhouse.com · 15 min

ClickHouse 可观测性三连发布：MCP Server、AI Notebooks 与 ClickStack 云服务ClickStack Observability: MCP Server, AI Notebooks, and ClickStack Cloud

ClickHouse 在 Open House 上发布了 ClickStack 可观测性的三大更新：全托管的 ClickStack Cloud（私有预览），AI Notebooks（测试版），以及开源的 ClickStack MCP Server。AI Notebooks 将事故排查设计为持久、可分支的调查工作区，而非单一聊天线程；底层直接调用 ClickStack 优化后的调查原语，每一步查询与推理都可见可编辑。MCP Server 将这些原语暴露给外部 AI 代理，内部基准测试显示工具调用减少 25%，一致性提升 2.5 倍；支持双向操作，代理既能分析也能直接在 ClickStack 中创建仪表盘。文章强调“自带代理”的理念，并指出结构化调查工具与原始 SQL 互补：SQL 是任意探索的逃生舱。所有更新都围绕一个方向：让可观测性工具更协作、更可编程，而不是锁定工作流。适合已用或评估 ClickHouse 做可观测性的基础设施/ SRE 工程师。

www.infoq.cn · 15 min

ClickHouse十大最佳实践：从主键到JOIN的深度优化指南ClickHouse 10 Best Practices

ClickHouse解决方案架构师分享十大可落地的最佳实践，涵盖主键设计、数据类型、分区策略、跳过索引、JSON类型、数据摄取、物化视图、系统表、ReplacingMergeTree与JOIN优化。每条实践都基于Amazon评论数据集（1.5亿行）的基准测试，给出量化性能差异：主键顺序错误导致全表扫描，优化后扫描量减少347倍；不必要分区让查询慢46倍；恰当的数据类型压缩存储12%、提速2倍；跳过索引减少80%扫描量；字典查找比常规JOIN快近3倍。全篇强调理解ClickHouse存储与合并机制，用实际数据验证设计决策的影响，适合正在或计划在生产环境使用ClickHouse的工程师对照优化。

章节 05

其他

1 / 38

x.com · 2 min

Harness 时代 AI-First 的组织架构Organizational Structure for AI-First in the Harness Era

播客《硅谷 101》邀请 Creao 三位创始人深入探讨 Harness Engineering——不是 Prompt 或 Context Engineering，而是围绕大模型搭建能自我修复、持续进化的系统。真正 AI-First 公司把 AI 作为生产力主导者，重构组织流程：开发周期从六周压缩到一天，产品经理角色被拆解，跨团队对齐由 AI 自动完成。反常识的是，初级工程师比资深者更适应这种环境，未来最稀缺的是跨架构、产品、营销的 generalist。他们还提出“Agent 经济”概念——未来内容可能更多服务于 AI Agent 而非人类。团队仅 25 人，两周完成架构重构，展示了 AI 产能对组织的冲击。推荐完整版逐字稿。

AI 工程的范式跃迁：从提示到驾驭

思维重塑：从提示到驾驭的范式转移

精通 Claude：配置、技巧与工作环境搭建

Agent 工程化：从代码生成到自主系统

数据与基础设施前沿

其他

每周一早上 · 一封邮件