标签 · KV‑Cache — Glean

06-29

AI Agent 上下文工程完全手册：为什么你的 Agent 在第 15 步开始变糟

本文系统阐述了上下文工程在构建 AI Agent 中的核心地位，指出 Agent 行为退化往往不是模型问题，而是上下文窗口管理不当。文章指出，Agent 的上下文窗口如同 RAM，随着工具调用、检索结果和对话历史累积，模型注意力会衰减，出现“中间丢失”和上下文腐败。作者给出了四大策略：Write（持久化信息到外部）、Select（按需检索）、Compress（压缩上下文）、Isolate（隔离不同任务的上下文），并详细分析了 4 种失败模式（中毒、分心、混淆、冲突）。文章还提供了具体数据：Chroma 基准测试表明所有模型在输入长度增加时性能连续下降，RAG‑MCP 将工具选择准确率从 14% 提升至 43% 且令牌用量减半，KV‑cache 缓存命中可使成本降低 10 倍。最后给出了一个在 7 小时内向 Rust 代码库提交约 35,000 行代码的实战工作流，适合所有需要构建可靠生产级 Agent 的工程师阅读。

x.com · 21 min · Agents · AI Engineering · Context Engineering

KV‑Cache

1 条 · 按时间

AI Agent 上下文工程完全手册：为什么你的 Agent 在第 15 步开始变糟