Glean 拾遗
日刊 · 时间线

每天拾几条。

2026-07-04 · 周六 3 条
← 07-03
日历 ▾
2026 · 07
MoTuWeThFrSaSu ··12345678910111213141516171819202122232425262728293031
有日刊 今天
06:00

Cursor 代理框架的持续改进:从上下文管理到模型定制

Continually Improving Our Agent Harness

Cursor 团队分享其代理框架(harness)的持续改进方法论。核心包括:上下文窗口从静态预填充演变为动态按需获取;通过离线基准(CursorBench)和在线 A/B 测试(基于代码留存率、用户意图识别)评估改动效果;建立工具调用错误分类体系(未知错误视为 bug,预期错误按原因归类)并利用异常检测与自动化日志分析(Cloud Agents)来追踪与修复退化;为不同模型定制工具格式与提示(如 OpenAI 的 patch 格式 vs Anthropic 的字符串替换),并处理模型特性(如“上下文焦虑”);支持会话中模型切换时自动切换对应框架并加入特殊指令避免工具混淆。最后展望多智能体架构——框架将负责智能体编排与结果缝合。适合一线 AI 工程、Agent 平台开发者阅读。

cursor.com · 13 min · Agent Engineering · Ai Tooling · Context Engineering · Cursor · Evaluation
06:00

让 LLM 直接操控真实浏览器的自适应 CDP 工具

Self-Healing Browser Harness That Lets LLMs Drive Any Real Browser

Browser Harness 是一个薄层自愈浏览器操控工具,让 LLM(如 Claude Code、Codex)通过 CDP 协议直接连接真实 Chrome 浏览器,完成任意网页任务。核心设计是“代理在运行中编写缺失的辅助代码”,即当代理遇到文件上传、跨域 iframe、滚动等场景时,自动生成可复用的 helper 函数并存储至 agent-workspace,下次同类操作无需重新探索。整个项目仅约 1000 行核心代码,无中间层,通过纯 WebSocket 直连浏览器 CDP 端点,赋予 LLM 完全的浏览器操控自由。适合需要让 AI 代理做真实网页操作(如数据抓取、自动化填写、复杂交互)的开发者。

github.com · 7 min · Agent Engineering · AI Agents · Browser Automation · CDP · Self-Healing
06:00

开源本地优先的设计工作台,兼容 22 种编程代理与 150+ 设计系统

Local-first, agentic design workspace with 22 CLI agents and 150+ brand systems

Open Design 是一款本地优先、开源的代理原生设计工作台,志在成为 Anthropic Claude Design 的开源替代。它不内置代理,而是与本地已有的编程代理(Claude Code、Codex、Cursor、Copilot 等 22 种 CLI)协作,利用 MCP 协议让它们读取设计系统、技能和插件,直接在终端生成原型、仪表盘、演示文稿、图像/视频等制品。支持 BYOK(自带密钥)兼容任意 OpenAI 端点,提供 macOS/Windows 原生桌面应用。内置 100+ 技能、150+ 品牌级 DESIGN.md 系统、261 款插件,适合追求品牌一致性与开发流程可控的设计师与前端工程师。

github.com · 35 min · Agent Engineering · Design Tools · Developer Tools · Mcp · Open Source