Glean 拾遗
← 所有期号
#001 最新 5/25–5/31 5 月 31 日发布

从敲提示到造系统:AI 工程的下一个范式已经到来

本周的 Glean 围绕一个清晰的技术演进主线展开:我们正在从「如何更好地提示 AI」时代,全面踏入「如何围绕 AI 构建工程系统」的深水区。当 Claude Code 推出动态工作流、ClickHouse 为 Agent 发布官方技能、Claude 托管代理拥有了跨会话的「梦境」与自我评估能力,一个明显的信号是——单点效率提升的红利正在见顶,真正的分水岭在于谁能将上下文工程、Harness Engineering 和组织架构重构整合为可重复、可治理的生产力体系。从卡帕西的三句痛点引发的配置哲学,到字节 TRAE 团队「上下文是护城河」的数据实证,我们为您梳理了本周最具代表性的实践、反思与工程蓝图。这一期,献给所有不甘于只做 AI 用户的构建者们。

38 篇 6 章 约 9 小时
章节 01

范式转移:从 Prompt 到 Context 再到 Harness

5 / 38
x.com · 12 min
01

上下文工程正在替代提示工程:五层框架与实践指南Context Engineering Is Replacing Prompt Engineering. Here's How It Works

本文提出「上下文工程」正在取代提示工程:随着模型理解力提升,瓶颈不再是提示词本身,而是模型可用的上下文信息。作者给出五层框架:身份上下文(告诉 Claude 你是谁)、知识上下文(上传关键文档)、记忆上下文(持续记录偏好)、工具上下文(接入邮件、日历、代码库等 MCP 工具)、流程上下文(用 Skill 文件固化工作流)。核心观点:精心设计的环境比精心编写的 prompt 更重要。文章偏实操指南,无实测数据,适合重度使用 Claude 的用户。

x.com · 3 min
02

从 Prompt 到 Context 再到 Harness:AI 工程的三次范式转移Prompt → Context → Harness: The Three Paradigms of AI Engineering

文章梳理了AI工程从Prompt Engineering (2023-2024)、Context Engineering (2025) 到Harness Engineering (2026初) 的三代范式转移。Harness Engineering 包含评估闭环、架构约束、记忆治理三层,分别由 Anthropic 和 OpenAI 的实操验证:Anthropic 的评估器 Agent 使 20 分钟产出不可用变为 6 小时产出完整游戏;OpenAI 五个月零手写构建百万行代码生产系统,依赖分层架构和 CI/linter 强制约束。两篇学术论文填补记忆层空白:(S)AGE 记忆系统通过拜占庭容错的 Proof of Experience 共识实现可信共享记忆,使 Agent 校准精度翻倍;纵向学习实验表明 3 行 prompt 加记忆与 200 行专家 prompt 性能持平,但前者随轮次显著提升。适合构建多 Agent 系统的工程师阅读。

www.infoq.cn · 18 min
03

从 OTel 到 Rotel:每秒处理量提升 4 倍的 PB 级追踪系统From OTel to Rotel: 4x Throughput Increase in PB-Scale Tracing

本文对比了 OpenTelemetry Collector 与 Rotel 在向 ClickHouse 写入追踪数据时的性能。在相同 8 核主机上,Rotel 实现每秒 370 万 trace span 的吞吐量(每核 46.25 万),是 OTel Collector 的 4 倍以上。性能提升源于三项关键优化:RowBinary 格式下的 JSON 列二进制编码,降低序列化开销;将反序列化迁移至共享线程池,消除 Tokio 任务阻塞及 glibc 内存分配器锁争用;启用快速 LZ4 压缩。测试还揭示了 OTel Collector 在反压下静默丢数据的缺陷。适合大规模可观测性数据管道的架构师与 SRE 参考。

x.com · 20 min
04

构建生产级AI智能体的十条工程原则how to build a production grade ai agent

超过40%的AI智能体项目因风险控制、架构和业务价值不清晰而失败,而非模型本身。本文从一线工程视角提出十条原则:从威胁建模、严格类型化工具契约、最小权限执行、上下文压缩、受控知识检索、确定性编排、记忆架构分离、可靠性机制到完整可观测性与持续治理。每条原则给出具体实现细节和真实案例(如Prompt注入在73%部署中出现),帮助工程团队将原型推向安全、可扩展的生产环境。

tw93.fun · 31 min
05

Agent 架构、工程实践与落地:从原则到 OpenClawAgent Unveiled: Principles, Architecture, and Engineering Practices

本文系统梳理了 Agent 系统的底层架构与工程实践,从稳定的 Agent Loop 控制流出发,对比 Workflow 与 Agent 的根本区别,解析五种常见控制模式及选型。重点强调 Harness(验收基线、执行边界、反馈信号、回退手段)比模型本身更决定系统收敛;上下文工程通过分层(常驻、按需、运行时、记忆、系统层)和三种压缩策略防止 Context Rot;工具设计遵循 ACI 原则,面向目标、参数防错、错误可修正;记忆系统分为工作、程序性、情景、语义四类,并通过整合与可回退机制实现跨会话一致性。还涵盖长任务跨 session 续跑、多 Agent 协议化协作、评测体系构建(Pass@k 与 Pass^k)以及基于事件流的可观测性。文章最终以 OpenClaw 的实现演示这些原则如何落地,适合需要构建稳健 Agent 系统的一线开发者。

章节 02

Claude 崛起:从聊天窗口到自主工程 Agent

12 / 38
x.com · 10 min
06

Claude 实战指南:18 个步骤解锁全部潜力How to Actually Use Claude. 18 steps that unlock 100% of its potential

这篇指南通过 18 个具体步骤,系统讲解如何深度使用 Claude。内容涵盖:用 Projects 和 Custom Instructions 建立持久上下文,摆脱每次重复解释自己;转变使用思维,将 Claude 视为思考伙伴而非搜索引擎;高级技巧如风格克隆、延伸思考、节省 Token 的指令;以及即用型提示模板(费曼学习法、旅行规划、财务分析、商业点子压力测试)。关键数据:指定输出长度一条指令即可减少 40-60% Token 消耗。适合所有希望突破基础问答、让 Claude 真正适配自己工作流的日常用户。

x.com · 11 min
07

Claude 隐藏功能全指南:17 个你不知道的用法Claude Can Do All of This. Most People Have No Idea.

本文详细介绍了 Claude 的 17 个隐藏功能,涵盖持久记忆(Projects)、聊天内构建可交互应用(Artifacts)、深度推理模式(Adaptive Thinking)、长期个人画像(Memory)、角色扮演提示词、浏览器代理(Claude in Chrome)、桌面文件系统访问(Cowork)、定时任务、技能插件、CLAUDE.md 项目规则、终端编码与调试(Claude Code)、可视化设计工具(Claude Design)以及 API 调用成本降低 90% 的提示缓存。每个功能附有开启位置和即用提示词,适合想实操上手 Claude 的工程师和效率控。

claude.com · 12 min
08

HTML 的超常效力:用 Claude Code 摆脱 MarkdownUsing Claude Code: The unreasonable effectiveness of HTML

Thariq Shihipar 分享了他用 Claude Code 生成 HTML 而非 Markdown 的实践。HTML 能表达表格、SVG、设计、交互,信息密度远超 Markdown;生成的文档更易读、分享,支持双向交互和自定义编辑界面。Claude Code 可结合代码库、Slack、git 历史等上下文,生成富含图表和代码片段的 HTML 报告、原型或审查界面。文章给出具体用例:从方案探索、代码审查、设计原型到定制编辑工具,并提供可复用的提示词模板。适合希望提升 Claude Code 输出可读性、交互性的开发者。

claude.com · 19 min
09

Claude Code 在大代码库中的工作方式:最佳实践与入门指南Claude Code in Large Codebases: Best Practices and Getting Started

本文介绍 Claude Code 在百万行级单体仓库、遗留系统及多仓库架构中的实际部署经验。核心观点:Claude Code 采用代理搜索(Agentic Search)而非 RAG 索引,避免了索引过期问题,但性能高度依赖代码库上下文配置。文章详细拆解了围绕模型的“扩展层”(Harness),包括 CLAUDE.md、Hooks、Skills、Plugins、MCP 服务器和 LSP 集成等组件,并给出了三个配置模式(使代码库可导航、随模型演进维护配置、分配管理责任)。适合正在或计划采用 Claude Code 的大型工程团队阅读。

x.com · 10 min
10

从 0 开始:用 Hooks 打造自动化 Claude Code 工作流From Scratch: Build Automated Claude Code Workflows with Hooks

本文介绍如何用 Claude Code Hooks 在生命周期节点自动执行 shell 命令,以替代依赖 prompt 的不可靠行为。涵盖 PostToolUse、PreToolUse 等 5 个关键事件,3 种 Hook 类型 (command/prompt/agent),及配置文件结构。提供 5 个即用 Hook 示例:桌面通知、自动格式化、文件保护、压缩后上下文恢复、commit 规范。退出码 2 可阻止危险操作并将 stderr 反馈给 Claude。适合希望让 Claude Code 工作流更稳定可靠的开发者。

tw93.fun · 20 min
11

拆解 Claude Code:六层架构、治理与工程实践Deconstructing Claude Code: Architecture, Governance, and Engineering Practices

作者基于半年深度使用 Claude Code 的实际踩坑,将 Claude Code 的功能拆解为六层(长期上下文、工具/MCP、Skills、Hooks、Subagents、Verifiers),并分别给出设计原则、反模式与配置示例。文章重点讨论了上下文工程(上下文成本构成、分层加载策略、压缩机制陷阱)、工具设计(如何让 Claude 少选错)、Hooks 的强制拦截场景、Subagents 的上下文隔离价值,以及 Prompt 缓存和验证闭环。最后给出项目级 CLAUDE.md 模板、混合语言项目 Hooks 实践与配置健康检查工具。适合希望将 Claude Code 从“ChatBot”升级为“可控工程 Agent”的一线工程师。

claude.com · 6 min
12

Claude Managed Agents 推出「梦境」、成果评估与多智能体编排Dreaming, Outcomes, and Multiagent Orchestration in Claude Managed Agents

Anthropic 在 Claude 托管代理中引入了「梦境」功能(研究预览),可跨会话审视记忆、提取模式并自我改进。同时推出成果评估(定义成功标准,由独立评估器评分,自动修正直至达标)和多智能体编排(主代理拆解任务,子代理并行处理)。文章提供了内部测试数据:成果评估在困难任务上提升 10 个百分点,docx/pptx 生成质量分别提升 8.4% 和 10.1%;并展示了 Harvey(法律工作完成率提升 6 倍)、Netflix(并行分析构建日志)、Spiral(用成果评估控制写作质量)、Wisedocs(文档审查提速 50%)等案例。适合关注 AI 代理自动化、质量控制和复杂任务分解的一线工程师。

x.com · 10 min
13

让 Claude Code 自动修复自身错误的完整配置How to Make Claude Code Fix Its Own Mistakes Automatically (Exact Setup You Can Copy)

本文详细介绍了如何配置 Claude Code(Anthropic 的 AI 编码辅助工具)使其自动发现、修复并记住自身错误,从而打破人工干预的循环。核心方法包括:维护一份持续增长的 CLAUDE.md 文件记录项目级规则和已犯错误;利用 PostToolUse 钩子在每次写入文件后自动格式化、类型检查并修复;使用 Stop 钩子在 Claude 声称完成时自动运行测试,失败则继续修复;通过 PreToolUse 钩子阻止危险操作(如写入 .env);结合跨会话记忆机制。文章提供了可直接复制的 settings.json 完整配置,并对比了使用前后(每个功能从 45 分钟手动往返降至 10 分钟无人值守)。适用读者:使用 Claude Code 的工程师、AI 辅助编程用户。

claude.com · 59 min
14

Claude Computer Use 工程落地指南:缩放、缓存与思考Best Practices for Computer and Browser Use with Claude

Anthropic 发布 Claude Computer Use 工程化落地指南,基于 4.6/4.7 系列模型的内部实测,系统覆盖截图缩放与点击精度、缓存断点布局与滚动缓冲区、服务端自动摘要、思维努力调优、提示注入防御,以及批量工具、顾问模式等实验特性。文中给出大量可运行的代码片段、具体参数阈值与调试方法,适合正在构建长链路桌面/浏览器自动化产品的工程师。

x.com · 16 min
15

Claude 100% 使用指南:大部分人只用到了 10%How to Use Claude at 100% — Most People Never Get Past 10%

本文是一份完整的 Claude 使用指南,揭秘了 17 个大多数用户从未尝试过的隐藏功能,包括 Projects(项目)、Artifacts(构件)、Extended Thinking(扩展思考)、Memory(记忆)、Claude in Chrome(浏览器插件)、Cowork(桌面应用)、Scheduled Tasks(定时任务)、Skills(技能)、CLAUDE.md(自动规则文件)、Claude Code(终端编码)、Claude Design(视觉设计)以及 Prompt Caching(提示缓存)等。每个功能都配有具体的位置说明、开启方法和即用提示词。适合希望将 Claude 从聊天工具升级为生产力系统的用户。

x.com · 9 min
16

我把Claude调教成工作系统:25个实用配置How I set up Claude to actually get work done

多数人用Claude只是单次问答,不保存上下文。作者分享了一套系统化配置方法:设置个人指令、分项目、上传参考文件、创建上下文文件、连接邮件日历、构建模板与工作流等,把Claude从聊天窗口变成可复用的工作环境。全文25个具体步骤,适合所有觉得AI助手回答随机、缺乏连贯性的技术工作者。

x.com · 15 min
17

用 CLAUDE.md 为 Claude 装上永久记忆:21 条配置指令指南CLAUDE.md Guide: 21 Instructions to Lock In Preferences and Context

大多数人使用Claude时不知道CLAUDE.md的存在——这个文件放在项目根目录,会话启动时自动读取,能永久固化你的偏好、上下文与行为规则。本文提供21条具体指令,分五部分:沟通风格(禁止寒暄、坦诚不确定性、按需匹配篇幅)、行为规范(大改前先请示、只改被要求的部分、事后总结变更)、用户上下文(角色背景、项目目标、写作风格)、记忆与连续性(用MEMORY.md记录决策、会话摘要、记录失败尝试)、以及面向开发者的7条规则,包括Andrej Karpathy的4条黄金法则(不要假设、用最简单方案、不改无关代码、明确标出不确定性),据称将编码准确率从65%提升至94%。适用所有想减少重复解释、提升Claude输出一致性的用户。

章节 03

开发者实践:规则、技能与自动化工作流

7 / 38
x.com · 14 min
18

字节TRAE AI编程手册精读:上下文是护城河ByteDance TRAE AI Coding Manuals: Context Engineering as Moat

字节跳动TRAE团队20篇AI编程实践手册的精要总结。核心论点是AI编程的效率瓶颈不在模型能力,而在上下文工程。文章详细介绍了六大方法论:Context Engineering、Skills、Spec Coding、Rules、MCP和Agentic Coding,并提供了大量实验数据(如32个真实Bug修复:有Skills加持成交率100%,无Skills仅59%)。适合一线开发者、Tech Lead和工程管理者阅读。

x.com · 13 min
19

5 种 ADK 开发者必备的 Agent Skill 设计模式5 Agent Skill Design Patterns Every ADK Developer Should Know

当前超过 30 种代理工具已统一 SKILL.md 格式,真正挑战转向内容设计。本文作者从 Anthropic、Vercel 和 Google 内部指南中总结出 5 种可复用设计模式:Tool Wrapper(按需加载库规范)、Generator(模板填空确保输出一致)、Reviewer(检查清单评分,按严重性归类)、Inversion(代理先采访用户再行动)、Pipeline(带门控条件的多步工作流)。每种模式均给出 ADK 可运行代码,适合需要构建可靠 AI Agent 的开发者参考。

vercel.com · 6 min
20

Vercel 发布 React 最佳实践仓库,面向 AI 编程代理优化Introducing React Best Practices: A Structured Repo for AI Agents

Vercel 将 10+ 年 React 与 Next.js 优化经验沉淀为 react-best-practices 仓库,包含 8 大类 40+ 规则,按影响度排序(从消除异步瀑布到 JavaScript 微优化)。每条规则配影响评级和代码修复示例,并生成 AGENTS.md 供 AI 代理查询。适用:需要系统化前端性能优化的团队与将 LLM 用于代码审查的工程师。

x.com · 5 min
21

用 Karpathy 的 autoresearch 方法,将你的 Claude Skills 效果提升10倍10x Your Claude Skills with Karpathy's Autoresearch Method

本文介绍如何用 Andrej Karpathy 的 autoresearch 方法自动迭代优化 Claude Skills。核心思路:给 agent 一份可打分的是/否 checklist,让它反复测试、改进你的 skill,每次判断改动是否有效。作者以落地页文案 skill 为例,通过4轮自动循环,质量检查通过率从56%提升至92%,并详细记录了每一轮改动及其理由。该方法适用于任何可量化评价的任务(如网站性能、开发邮件、文章开头),只需定义好评分标准。文章提供了可直接运行的 skill 下载,适合已搭建 AI 工作流但苦于质量不稳定的工程师实践参考。

x.com · 2 min
22

卡帕西三句话,说破每个Claude Code用户的痛点Andrej Karpathy wrote something that every Claude Code user has felt b

安德烈·卡帕西对LLM行为的三点观察——静默假设、过度复杂化代码、粗心副效应——催生了一个单一的CLAUDE.md文件,内含四个原则:编码前先思考、简单至上、手术式修改、目标驱动执行。每条原则直指一个痛点。文件可直接放入任何项目,约束AI编程助手输出更严谨的代码。所有Claude Code用户都有同感,却难以言说。

danielabaron.me · 12 min
23

用AI安全网重构CSS:零视觉变化的七阶段计划CSS Refactoring with an AI Safety Net

作者将一团乱麻的CSS用AI辅助重构,分7个阶段,全程保持视觉效果不变。借助Playwright自动截图9个应用状态,每个阶段后用Claude Code对比截图,自动发现任何视觉差异(如行高变化)。重构后CSS采用@layer层级、现代重置、统一按钮基类和CSS变量,整个流程耗时约3小时。文章详细介绍了枚举状态、编写脚本、用AI读图对比的经验,并讨论了为何选择AI而非专用视觉回归工具。适合前端开发者学习如何安全重构遗留样式。

claude.com · 7 min
24

Claude Code 推出动态工作流:端到端跑完大型任务,自动并行调度与校验Introducing dynamic workflows in Claude Code

Claude Code 新增动态工作流能力,允许单会话内动态生成编排脚本,并行启动数十到数百个子代理,自动拆解任务、交叉验证结果,端到端完成大型工程任务。典型场景包括代码库级 Bug 排查、大规模迁移、安全审计等。Bun 团队用此功能 11 天将 Bun 从 Zig 迁移至 Rust,生成约 75 万行代码,已有 99.8% 测试通过。工作流会在执行前展示计划并请求确认,任务中断后可接续执行,但 token 消耗显著高于普通会话。适用:希望用 Claude Code 处理大型、复杂任务的开发者,目前面向 Max、Team、Enterprise 用户。

章节 04

组织、思维与协作方式的重构

8 / 38
x.com · 19 min
25

为什么你的“AI 优先”战略可能错了Why Your “AI-First” Strategy Is Probably Wrong

本文作者是平台公司 CTO,亲身实践将整个工程流程重构为 AI 原生:99% 生产代码由 AI 生成,一天内完成从想法到上线的迭代。文章批判了仅添加 AI 工具的“AI 辅助”模式,提出“驾驭工程”概念,详细拆解了技术栈、自愈反馈循环、新工程角色(架构师与操作员),并给出 3–8 次日部署的真实数据。适合正在思考如何真正将 AI 融入研发流程的工程团队和技术决策者。

www.akashbajwa.co · 12 min
26

Anthropic 圆桌:软件工程的未来The Future Of Software Engineering with Anthropic

本文总结了一场 Anthropic 组织的软件工程未来圆桌讨论,汇集 Stripe、NVIDIA、微软等公司工程领袖的洞察。讨论重点包括:闭环开发带来复利效应,测试先行成为默认实践,人工代码审查逐渐退场,注释开始为 AI 可读性而写。长周期自主代理任务仍是前沿难题,开发者工具最先被替代,而企业软件更具粘性。招聘更看重实验精神而非原始技能,上下文管理仍待解决,人类编写的上下文优于代理生成的。文章提供了来自一线实践的具体案例和真实权衡。

x.com · 12 min
27

编码代理如何重塑工程、产品与设计How Coding Agents Are Reshaping Engineering, Product and Design

编码智能体(coding agents)正在颠覆传统的工程-产品-设计(EPD)协作模式。过去,产品需求文档(PRD)是构建软件的起点,设计据此制作原型,再由工程实现。如今,编码智能体让任何人都能快速生成代码,导致实现成本骤降,瓶颈从实现转向评审。传统PRD已死,但描述产品意图的文档仍不可或缺,甚至可能演变为结构化的提示词(prompts)。这种变化对角色产生深远影响:通才价值飙升,因为一个人借助智能体就能快速构建原型;精益求精的系统思维成为核心技能;人人都需要产品感来决定构建什么;专业化的门槛提高,角色边界模糊,从业者要么成为自主构建者,要么成为深度评审者。最终,无论产品、设计还是工程背景,能深刻理解产品与技术的人将成为最大受益者。

www.bassimeledath.com · 22 min
28

Agentic 工程的八个层级:从自动补全到自治团队The 8 Levels of Agentic Engineering

Bassim Eledath 将 AI 辅助编程的实践演进分为八个层级:从最早的 Tab 补全和 AI IDE,到上下文工程、复合工程、MCP/技能、反馈循环、后台代理,最终走向自治代理团队。他强调每一层都必须建立在前一层的基础上——混乱的上下文、缺失的约束或不合适的工具会让高级阶段放大混乱。文章分享了多个实战案例(如共享 PR 审查技能、多模型派发系统),并提出了计划模式正在消亡、实施与审查必须分离等尖锐观点,是为工程团队提升 AI 生产力提供的务实路线图。

articles.zimetic.com · 8 min
29

超越编码助手:企业级 AI 辅助软件工程系列开篇Beyond the Coding Assistant — A New Series

本免费系列探讨 AI 辅助软件工程在企业规模下的真实面貌:个体编码效率大幅提升,但许多团队交付速度并未同步,甚至下降。作者指出当前 AI 编码助手仅优化单一角色,而软件交付需全员参与,主张未来应关注生命周期编排而非单纯生成代码。系列分四部分,涵盖现状分析、问题重构、设计原则与展望,每周一三五更新,无付费墙。适合工程领导者、架构师和对 AI 工程化感兴趣的开发者。

x.com · 2 min
30

Harness 时代 AI-First 的组织架构Organizational Structure for AI-First in the Harness Era

播客《硅谷 101》邀请 Creao 三位创始人深入探讨 Harness Engineering——不是 Prompt 或 Context Engineering,而是围绕大模型搭建能自我修复、持续进化的系统。真正 AI-First 公司把 AI 作为生产力主导者,重构组织流程:开发周期从六周压缩到一天,产品经理角色被拆解,跨团队对齐由 AI 自动完成。反常识的是,初级工程师比资深者更适应这种环境,未来最稀缺的是跨架构、产品、营销的 generalist。他们还提出“Agent 经济”概念——未来内容可能更多服务于 AI Agent 而非人类。团队仅 25 人,两周完成架构重构,展示了 AI 产能对组织的冲击。推荐完整版逐字稿。

www.koshyjohn.com · 11 min
31

工程思维的分水岭:你是在用 AI 提升层次,还是外包思考?A.I. Should Elevate Your Thinking, Not Replace It

软件工程界正分裂为两类人:一类用AI移除苦差、加速并专注于更高层次的工作(定义问题、权衡取舍、发现风险);另一类用AI避免思考,将AI生成的输出当作自己的成果。作者将这种现象称为“外包思维”,它是一种新的失败模式,看似高效,实则侵蚀判断力。文章通过类比说明,跳过技能培养最终会导致能力空心化。真正有价值的工程师不是代码产量最高,而是能发现隐藏约束、分解模糊问题、创造清晰见解。领导层也面临同样考验:能否区分表面流利与真实技术深度,直接决定组织健康。本文适合所有软件工程师和工程管理者,引发关于AI时代职业发展的深度反思。

spin.atomicobject.com · 7 min
32

你的最佳提示就是一份定义清晰的用户故事Your Best Prompt Is a Well-Defined User Story

在代理式开发时代,用户故事的质量直接影响 AI 产出。文章主张团队应把更多时间花在拆解故事和编写清晰的验收标准上,而非仅仅估算故事点。一个清晰的故事应包含三部分:背景、验收标准和技术假设。故事点估算仅当需要发布预测或发现团队认知差异时才有价值,否则可省去。好的故事就是好的提示,能显著加速开发周期。适用于采用敏捷 / Scrum 的工程团队。

章节 05

基础设施实战:ClickHouse 与可观测性新姿态

4 / 38
clickhouse.com · 3 min
33

ClickHouse 发布 Agent Skills:28 条规则让 AI 助手学会 ClickHouseIntroducing ClickHouse Agent Skills

ClickHouse 发布了官方 Agent Skills,一套开源的最佳实践规则集,基于 Anthropic 的 Agent Skills 规范打包了 28 条经工程师和社区验证的 ClickHouse 实操规则,涵盖 Schema 设计、查询优化和数据摄入。执行 npx skills add clickhouse/agent-skills 即可添加到本地环境,AI 助手(如 Claude Code)会自动在需要时调用这些规则,避免常见错误(如错误的 ORDER BY、不可扩展的 JOIN、遗漏物化视图)。仓库使用 Apache 2.0 许可,欢迎社区贡献经验。

www.infoq.cn · 15 min
34

ClickHouse十大最佳实践:从主键到JOIN的深度优化指南ClickHouse 10 Best Practices

ClickHouse解决方案架构师分享十大可落地的最佳实践,涵盖主键设计、数据类型、分区策略、跳过索引、JSON类型、数据摄取、物化视图、系统表、ReplacingMergeTree与JOIN优化。每条实践都基于Amazon评论数据集(1.5亿行)的基准测试,给出量化性能差异:主键顺序错误导致全表扫描,优化后扫描量减少347倍;不必要分区让查询慢46倍;恰当的数据类型压缩存储12%、提速2倍;跳过索引减少80%扫描量;字典查找比常规JOIN快近3倍。全篇强调理解ClickHouse存储与合并机制,用实际数据验证设计决策的影响,适合正在或计划在生产环境使用ClickHouse的工程师对照优化。

clickhouse.com · 15 min
35

ClickHouse 可观测性三连发布:MCP Server、AI Notebooks 与 ClickStack 云服务ClickStack Observability: MCP Server, AI Notebooks, and ClickStack Cloud

ClickHouse 在 Open House 上发布了 ClickStack 可观测性的三大更新:全托管的 ClickStack Cloud(私有预览),AI Notebooks(测试版),以及开源的 ClickStack MCP Server。AI Notebooks 将事故排查设计为持久、可分支的调查工作区,而非单一聊天线程;底层直接调用 ClickStack 优化后的调查原语,每一步查询与推理都可见可编辑。MCP Server 将这些原语暴露给外部 AI 代理,内部基准测试显示工具调用减少 25%,一致性提升 2.5 倍;支持双向操作,代理既能分析也能直接在 ClickStack 中创建仪表盘。文章强调“自带代理”的理念,并指出结构化调查工具与原始 SQL 互补:SQL 是任意探索的逃生舱。所有更新都围绕一个方向:让可观测性工具更协作、更可编程,而不是锁定工作流。适合已用或评估 ClickHouse 做可观测性的基础设施/ SRE 工程师。

blog.cloudflare.com · 18 min
36

Glasswing 项目:Mythos 的安全漏洞挖掘实战与启示Project Glasswing: What Mythos Showed Us

Cloudflare 在 Project Glasswing 中深度试用 Anthropic 的 Mythos Preview 模型,对其 50 多个自有仓库进行了安全扫描。该模型的核心进步在于能自动将多个低危漏洞串联成完整利用链,并生成可执行的 PoC,使漏洞验证从猜测变为可操作。实际使用暴露出模型拒绝不一致、信噪比等问题,单一通用 coding agent 效果不佳。Cloudflare 构建了包含侦察、狩猎、验证、补缺、去重、追踪、反馈和报告的八阶段编排框架,用并行窄域任务和对抗性复核大幅提升质量。文章最后指出,仅加快修补不够,需从架构上限制漏洞可达性,并预告后续面向客户的实践分享。

章节 06

其他

2 / 38
x.com · 19 min
37

Claude Code Dynamic Workflows:把编排逻辑搬进代码的新原语Claude Code Dynamic Workflows: A New Primitive That Moves Orchestration Into Code

Anthropic 发布 Dynamic Workflows,一种将大规模任务编排写成 JavaScript 脚本、交由独立运行时执行的原语。脚本持有循环、分支和中间结果,主 Claude 上下文仅接收最终答案,解决了 subagent 和 Agent Teams 面临的上百个并行任务时上下文溢出与注意力稀释的瓶颈。文章详解架构、原语与执行模型,并以 Bun 迁移 Rust(11 天/75 万行/99.8% 测试通过)和个人 133 会话分析案例展示效果。对比 n8n/Coze/Dify 后指出,Workflow 是“确定性脚本 + 节点调 LLM”,图灵完备的代码表达力优于可视化 DAG,且编排可由模型现场生成。适用代码库级排查、大迁移、对抗验证等场景,但 token 消耗高、有并发与恢复等限制。适合需要大规模自动化编码任务的工程师。