Glean 拾遗
日刊 · 时间线

每天拾几条。

2026-05-29 · 周五 11 条
← 05-28
日历 ▾
2026 · 05
MoTuWeThFrSaSu ····12345678910111213141516171819202122232425262728293031
有日刊 今天
05-30 →
17:56

Claude Code Dynamic Workflows:把编排逻辑搬进代码的新原语

Claude Code Dynamic Workflows: A New Primitive That Moves Orchestration Into Code

Anthropic 发布 Dynamic Workflows,一种将大规模任务编排写成 JavaScript 脚本、交由独立运行时执行的原语。脚本持有循环、分支和中间结果,主 Claude 上下文仅接收最终答案,解决了 subagent 和 Agent Teams 面临的上百个并行任务时上下文溢出与注意力稀释的瓶颈。文章详解架构、原语与执行模型,并以 Bun 迁移 Rust(11 天/75 万行/99.8% 测试通过)和个人 133 会话分析案例展示效果。对比 n8n/Coze/Dify 后指出,Workflow 是“确定性脚本 + 节点调 LLM”,图灵完备的代码表达力优于可视化 DAG,且编排可由模型现场生成。适用代码库级排查、大迁移、对抗验证等场景,但 token 消耗高、有并发与恢复等限制。适合需要大规模自动化编码任务的工程师。

x.com · 19 min · Agents · AI · Framework
14:47

上下文工程正在替代提示工程:五层框架与实践指南

Context Engineering Is Replacing Prompt Engineering. Here's How It Works

本文提出「上下文工程」正在取代提示工程:随着模型理解力提升,瓶颈不再是提示词本身,而是模型可用的上下文信息。作者给出五层框架:身份上下文(告诉 Claude 你是谁)、知识上下文(上传关键文档)、记忆上下文(持续记录偏好)、工具上下文(接入邮件、日历、代码库等 MCP 工具)、流程上下文(用 Skill 文件固化工作流)。核心观点:精心设计的环境比精心编写的 prompt 更重要。文章偏实操指南,无实测数据,适合重度使用 Claude 的用户。

x.com · 12 min · AI · Framework · LLM
09:11

从 Prompt 到 Context 再到 Harness:AI 工程的三次范式转移

Prompt → Context → Harness: The Three Paradigms of AI Engineering

文章梳理了AI工程从Prompt Engineering (2023-2024)、Context Engineering (2025) 到Harness Engineering (2026初) 的三代范式转移。Harness Engineering 包含评估闭环、架构约束、记忆治理三层,分别由 Anthropic 和 OpenAI 的实操验证:Anthropic 的评估器 Agent 使 20 分钟产出不可用变为 6 小时产出完整游戏;OpenAI 五个月零手写构建百万行代码生产系统,依赖分层架构和 CI/linter 强制约束。两篇学术论文填补记忆层空白:(S)AGE 记忆系统通过拜占庭容错的 Proof of Experience 共识实现可信共享记忆,使 Agent 校准精度翻倍;纵向学习实验表明 3 行 prompt 加记忆与 200 行专家 prompt 性能持平,但前者随轮次显著提升。适合构建多 Agent 系统的工程师阅读。

x.com · 3 min · Agents · AI · LLM
09:11

用 Karpathy 的 autoresearch 方法,将你的 Claude Skills 效果提升10倍

10x Your Claude Skills with Karpathy's Autoresearch Method

本文介绍如何用 Andrej Karpathy 的 autoresearch 方法自动迭代优化 Claude Skills。核心思路:给 agent 一份可打分的是/否 checklist,让它反复测试、改进你的 skill,每次判断改动是否有效。作者以落地页文案 skill 为例,通过4轮自动循环,质量检查通过率从56%提升至92%,并详细记录了每一轮改动及其理由。该方法适用于任何可量化评价的任务(如网站性能、开发邮件、文章开头),只需定义好评分标准。文章提供了可直接运行的 skill 下载,适合已搭建 AI 工作流但苦于质量不稳定的工程师实践参考。

x.com · 5 min · Agents · AI
09:11

ClickHouse十大最佳实践:从主键到JOIN的深度优化指南

ClickHouse 10 Best Practices

ClickHouse解决方案架构师分享十大可落地的最佳实践,涵盖主键设计、数据类型、分区策略、跳过索引、JSON类型、数据摄取、物化视图、系统表、ReplacingMergeTree与JOIN优化。每条实践都基于Amazon评论数据集(1.5亿行)的基准测试,给出量化性能差异:主键顺序错误导致全表扫描,优化后扫描量减少347倍;不必要分区让查询慢46倍;恰当的数据类型压缩存储12%、提速2倍;跳过索引减少80%扫描量;字典查找比常规JOIN快近3倍。全篇强调理解ClickHouse存储与合并机制,用实际数据验证设计决策的影响,适合正在或计划在生产环境使用ClickHouse的工程师对照优化。

www.infoq.cn · 15 min · Database · Performance
09:10

Vercel 发布 React 最佳实践仓库,面向 AI 编程代理优化

Introducing React Best Practices: A Structured Repo for AI Agents

Vercel 将 10+ 年 React 与 Next.js 优化经验沉淀为 react-best-practices 仓库,包含 8 大类 40+ 规则,按影响度排序(从消除异步瀑布到 JavaScript 微优化)。每条规则配影响评级和代码修复示例,并生成 AGENTS.md 供 AI 代理查询。适用:需要系统化前端性能优化的团队与将 LLM 用于代码审查的工程师。

vercel.com · 6 min · AI · Performance · React
09:10

ClickHouse 可观测性三连发布:MCP Server、AI Notebooks 与 ClickStack 云服务

ClickStack Observability: MCP Server, AI Notebooks, and ClickStack Cloud

ClickHouse 在 Open House 上发布了 ClickStack 可观测性的三大更新:全托管的 ClickStack Cloud(私有预览),AI Notebooks(测试版),以及开源的 ClickStack MCP Server。AI Notebooks 将事故排查设计为持久、可分支的调查工作区,而非单一聊天线程;底层直接调用 ClickStack 优化后的调查原语,每一步查询与推理都可见可编辑。MCP Server 将这些原语暴露给外部 AI 代理,内部基准测试显示工具调用减少 25%,一致性提升 2.5 倍;支持双向操作,代理既能分析也能直接在 ClickStack 中创建仪表盘。文章强调“自带代理”的理念,并指出结构化调查工具与原始 SQL 互补:SQL 是任意探索的逃生舱。所有更新都围绕一个方向:让可观测性工具更协作、更可编程,而不是锁定工作流。适合已用或评估 ClickHouse 做可观测性的基础设施/ SRE 工程师。

clickhouse.com · 15 min · Agents · AI · Database
09:10

从 OTel 到 Rotel:每秒处理量提升 4 倍的 PB 级追踪系统

From OTel to Rotel: 4x Throughput Increase in PB-Scale Tracing

本文对比了 OpenTelemetry Collector 与 Rotel 在向 ClickHouse 写入追踪数据时的性能。在相同 8 核主机上,Rotel 实现每秒 370 万 trace span 的吞吐量(每核 46.25 万),是 OTel Collector 的 4 倍以上。性能提升源于三项关键优化:RowBinary 格式下的 JSON 列二进制编码,降低序列化开销;将反序列化迁移至共享线程池,消除 Tokio 任务阻塞及 glibc 内存分配器锁争用;启用快速 LZ4 压缩。测试还揭示了 OTel Collector 在反压下静默丢数据的缺陷。适合大规模可观测性数据管道的架构师与 SRE 参考。

www.infoq.cn · 18 min · Database · Performance
09:10

工程思维的分水岭:你是在用 AI 提升层次,还是外包思考?

A.I. Should Elevate Your Thinking, Not Replace It

软件工程界正分裂为两类人:一类用AI移除苦差、加速并专注于更高层次的工作(定义问题、权衡取舍、发现风险);另一类用AI避免思考,将AI生成的输出当作自己的成果。作者将这种现象称为“外包思维”,它是一种新的失败模式,看似高效,实则侵蚀判断力。文章通过类比说明,跳过技能培养最终会导致能力空心化。真正有价值的工程师不是代码产量最高,而是能发现隐藏约束、分解模糊问题、创造清晰见解。领导层也面临同样考验:能否区分表面流利与真实技术深度,直接决定组织健康。本文适合所有软件工程师和工程管理者,引发关于AI时代职业发展的深度反思。

www.koshyjohn.com · 11 min · AI
09:10

ClickHouse 发布 Agent Skills:28 条规则让 AI 助手学会 ClickHouse

Introducing ClickHouse Agent Skills

ClickHouse 发布了官方 Agent Skills,一套开源的最佳实践规则集,基于 Anthropic 的 Agent Skills 规范打包了 28 条经工程师和社区验证的 ClickHouse 实操规则,涵盖 Schema 设计、查询优化和数据摄入。执行 npx skills add clickhouse/agent-skills 即可添加到本地环境,AI 助手(如 Claude Code)会自动在需要时调用这些规则,避免常见错误(如错误的 ORDER BY、不可扩展的 JOIN、遗漏物化视图)。仓库使用 Apache 2.0 许可,欢迎社区贡献经验。

clickhouse.com · 3 min · Agents · AI · Database
09:10

Harness 时代 AI-First 的组织架构

Organizational Structure for AI-First in the Harness Era

播客《硅谷 101》邀请 Creao 三位创始人深入探讨 Harness Engineering——不是 Prompt 或 Context Engineering,而是围绕大模型搭建能自我修复、持续进化的系统。真正 AI-First 公司把 AI 作为生产力主导者,重构组织流程:开发周期从六周压缩到一天,产品经理角色被拆解,跨团队对齐由 AI 自动完成。反常识的是,初级工程师比资深者更适应这种环境,未来最稀缺的是跨架构、产品、营销的 generalist。他们还提出“Agent 经济”概念——未来内容可能更多服务于 AI Agent 而非人类。团队仅 25 人,两周完成架构重构,展示了 AI 产能对组织的冲击。推荐完整版逐字稿。

x.com · 2 min · Agents · AI · Framework