Glean 拾遗
最近收录

1 条 · 按时间

06-29

AI Agent 上下文工程完全手册:为什么你的 Agent 在第 15 步开始变糟

本文系统阐述了上下文工程在构建 AI Agent 中的核心地位,指出 Agent 行为退化往往不是模型问题,而是上下文窗口管理不当。文章指出,Agent 的上下文窗口如同 RAM,随着工具调用、检索结果和对话历史累积,模型注意力会衰减,出现“中间丢失”和上下文腐败。作者给出了四大策略:Write(持久化信息到外部)、Select(按需检索)、Compress(压缩上下文)、Isolate(隔离不同任务的上下文),并详细分析了 4 种失败模式(中毒、分心、混淆、冲突)。文章还提供了具体数据:Chroma 基准测试表明所有模型在输入长度增加时性能连续下降,RAG‑MCP 将工具选择准确率从 14% 提升至 43% 且令牌用量减半,KV‑cache 缓存命中可使成本降低 10 倍。最后给出了一个在 7 小时内向 Rust 代码库提交约 35,000 行代码的实战工作流,适合所有需要构建可靠生产级 Agent 的工程师阅读。

x.com · 21 min · Agents · AI Engineering · Context Engineering