Glean 拾遗
最近收录

2 条 · 按时间

06-16

为 AI Agent 打造的本土上下文压缩层:库、代理、MCP 一应俱全

Headroom 是一个本地运行的上下文压缩层,专为 AI 编码智能体设计。它能在 LLM 收到工具输出、日志、代码文件或 RAG 结果之前,对这些内容进行高保真压缩,在保持答案准确性的前提下,将 Token 消耗降低 60-95%。项目提供了库(Python/JS)、透明代理、命令行 wrap 和 MCP 服务器四种集成方式,无缝适配 Claude Code、Cursor、Codex 等主流智能体。其核心思路是结合 JSON 结构压缩、AST 感知代码精简与本地微调模型,并独创了 CCR 可逆压缩机制,确保原始信息随时可召回,避免了压缩带来的信息丢失风险。该工具适合重度依赖智能体编程、希望在不修改现有工作流的情况下显著降低 API 开销的工程师。

github.com · 18 min · Agents · Ast-Minification · Context Engineering
06-16

AI 代理上下文压缩层:60%-95% Token 削减,不丢失关键信息

Headroom 是一个本地运行的 AI 代理上下文压缩工具,旨在显著降低 LLM 使用成本与延迟。它在工具输出、日志、RAG 数据块及对话历史到达大模型前进行智能压缩,支持 JSON、代码和自然语言等多类内容。项目提供库、代理、MCP 服务器和代理包装器四种集成模式,通过内容路由选择最优压缩算法,并具备可逆压缩(CCR)机制确保原始数据不被丢弃。它还包含跨代理记忆共享和从失败会话中学习的 `headroom learn` 命令,适合每天高强度使用编程代理的工程师和任何需要优化 LLM Token 消耗的系统。

github.com · 18 min · Agent Architecture · Ai-Memory · Context Engineering