Glean 拾遗
最近收录

4 条 · 按时间

06-12

Claude Projects 深度指南:25 个被低估的特性、工作流与技巧

本文由 @eng_khairallah1 撰写,系统梳理了 Claude Projects 从基础配置到高级策略的 25 个实战技巧。核心观点在于,Projects 不应被当作一次性对话工具,而是需要通过结构化指令模板、分类知识库上传和持续校准,将其打造成一个随时间不断进化的持久化工作区。文中提供了具体可操作的模板,如 'ROLE/CONTEXT/RULES/OUTPUT' 指令框架、'竞争力情报中心' 和 '客户专属项目' 的设置方法,并强调了通过 '反馈日志' 和 '季度刷新' 实现指令的复利优化。本文适合希望摆脱重复向 Claude 解释背景、寻求更高效和个性化 AI 协作方式的深度用户阅读。

x.com · 16 min · Agent Architecture · AI Engineering · Anthropic
06-11

如何为 Claude Fable 5 设计循环:自校正与跨会话记忆

R. Lance Martin 分享了针对 Anthropic 最新模型 Fable 5 的两类循环设计实验:自校正和工作记忆。在自校正环节,他用 Parameter Golf 挑战(训练一个能塞进 16MB、在 8xH100 上 10 分钟内跑完的模型)对比了 Fable 5 和 Opus 4.7。在 Claude Managed Agents (CMA) 环境下,Fable 5 通过 Outcomes 生成的 grading 子 agent 做独立验证,训练流水线的改进幅度是 Opus 4.7 的约 6 倍,且更敢于做结构性变更而非只调标量参数。在工作记忆实验中,基于 Continual Learning Bench 1.0 的任务,Fable 5 在连续 SQL 问答中展现出一条从记录失败、调查原因、交叉验证到抽象为通用规则的完整记忆链,验证覆盖率达到 73%,显著超过 Opus 4.7 和 Sonnet 4.6。文章适合正在为强模型设计 agent 循环的工程师阅读,核心主张是提供环境和反馈让模型自行爬坡,比直接提示更有效。

x.com · 5 min · Agent Architecture · Agents · AI Engineering
06-10

Claude Fable 5 实战:用自校正循环和跨会话记忆打磨代理任务

作者分享了使用 Anthropic 的 Claude Fable 5 模型提升代理工作效能的两个实战方向:自校正循环和跨会话记忆。在自校正循环实验中,作者用 Parameter Golf——一个要求在 16MB 模型体积、8xH100 GPU 上 10 分钟内训练最佳模型的公开挑战——比较了 Fable 5 与 Opus 4.7 的表现。通过 Claude Managed Agents 提供的 Outcomes 原语,由独立验证子代理根据九项可检查标准评分,Fable 5 对训练管线的改进幅度约为 Opus 4.7 的 6 倍。Fable 5 更倾向于做结构性改动,并在遇到量化性能回退时展现出韧性,而 Opus 4.7 则停留在调整标量超参数的模板上。在记忆实验中,作者使用 Continual Learning Bench 1.0 中的 SQL 问答任务,对比了 Fable 5、Opus 4.7 和 Sonnet 4.6 利用文件系统跨会话记忆的能力。Sonnet 4.6 仅记录失败和未验证猜测,Opus 4.7 能创建带不确定性标记的 schema 参考但验证覆盖率中位数仅 17%;Fable 5 最强运行中验证覆盖率达 73% 并将学习提炼为通用规则。文章适合关注代理架构设计和模型能力边界的工程师阅读。

x.com · 5 min · Agent Architecture · AI Agents · AI Engineering
06-08

Claude Code 动态工作流实战:6 种模式与 14 步完整指南

本文系统梳理了 Claude Code 于 2026 年 5 月底发布的 Dynamic Workflows 功能。不同于手动串联 prompts 或编写死板的静态 harness,动态工作流让 Claude 为特定任务即时生成定制的 JavaScript 控制程序。文章从底层思维模型切入,解释了工作流如何从结构上解决单一上下文窗口面临的三类失效:智能体惰性(提前终止)、自我偏好偏差(无法客观验证自身输出)及目标漂移(长对话后丢失约束)。随后逐一拆解 6 种核心模式:分类后路由(classify-and-act)、扇出后综合(fan-out-and-synthesize)、对抗性验证(adversarial verification)、生成后筛选(generate-and-filter)、竞标赛排序(tournament)以及循环至完成(loop until done),并提供了实际的代码骨架。最后,文章展示了如何组合这些模式来解决迁移重构、深度研究、大规模分诊、代码评审等真实场景的问题,同时强调了使用 /goal、/loop 及 token 预算控制成本、用隔离模式防范来自不可信输入的提示注入风险、以及将成功的工作流保存并打包为 Skill 分发的实操技巧。适合已在使用 Claude Code 并希望突破单 agent 限制,处理长周期、高并行或需要严格校验的复杂任务的工程师阅读。

x.com · 17 min · Agents · AI Engineering · Anthropic