Cursor 代理框架的持续改进:从上下文管理到模型定制
Cursor 团队分享其代理框架(harness)的持续改进方法论。核心包括:上下文窗口从静态预填充演变为动态按需获取;通过离线基准(CursorBench)和在线 A/B 测试(基于代码留存率、用户意图识别)评估改动效果;建立工具调用错误分类体系(未知错误视为 bug,预期错误按原因归类)并利用异常检测与自动化日志分析(Cloud Agents)来追踪与修复退化;为不同模型定制工具格式与提示(如 OpenAI 的 patch 格式 vs Anthropic 的字符串替换),并处理模型特性(如“上下文焦虑”);支持会话中模型切换时自动切换对应框架并加入特殊指令避免工具混淆。最后展望多智能体架构——框架将负责智能体编排与结果缝合。适合一线 AI 工程、Agent 平台开发者阅读。