Glean 拾遗
日刊 · 时间线

每天拾几条。

2026-07-02 · 周四 3 条
← 07-01
日历 ▾
2026 · 07
MoTuWeThFrSaSu ··12345678910111213141516171819202122232425262728293031
有日刊 今天
06:00

做了些爆款 Skills 后,我对 Skills 的看法

What I Learned About Agent Skills from Building Popular Ones

作者基于自己开发的 PPT、社交媒体卡片、Logo 生成器、AI Desk Card 等爆款 Skill,提出 Agent 并非抹平能力差距,而是放大差距。Skill 是封装专家经验、工作流、品味和工具调用的可复用能力单元,能弥合使用差距。文章深入讨论了 Skill 的核心——把人的经验外化,设计 Skill 是把品味变成可执行的约束;架构上应遵循“中心短、辐射厚”,SKILL.md 只放高信号流程,重文档按需读取;质量需像代码一样维护,gotchas 来自真实失败最有价值;生态不应是仓库列表,每个 Skill 应像软件功能页展示结果和场景;分发策略是 GitHub 打基础,内容平台做传播,形成“文章、产品、案例互相喂养”的复利飞轮。最后给出完整生命周期:从真实需求出发,经过高质量产物、抽象流程、工程化模板、跨模型测试、发布分发到反馈迭代。本文适合 AI Agent 开发者、产品经理和内容创作者,提供了大量具体案例和可操作的设计原则。

06:00

微代理:在模型API层内协作,超越前沿模型

Micro-Agent: Beat Frontier Models with Collaboration inside Model API

vLLM Semantic Router 提出了一个不同寻常的视角:路由器不只是请求分发器,更是模型能力的放大器。其核心思想是将多个模型的协作封装在同一个模型 API 调用内,用户看到的仍然是一个普通模型端点(vllm-sr/auto),但背后路由器可以根据任务自动选择协作模式——从成本感知的串行升级(Confidence)、并行聚合(Ratings),到多轮推理合成(ReMoM)、分歧发现(Fusion),乃至带资源预算的微代理工作流(Workflows)。这些模式都是可控、可配、可观测的运行时,而非应用层胶水代码。评测显示,在 LiveCodeBench、GPQA-Diamond、Humanity's Last Exam 三个硬基准上,这套闭源模型协作方案(VSR Closed)分别达到 92.6%、96.0%、50.0%,持平或超过了 Fugu Ultra、GPT-5.5 等单一前沿模型。这篇博文的价值在于,它首次把“多模型协作”从产品端或应用端下沉到了 serving 基础设施层,并且坚持以一个模型身份暴露,极大降低了接入成本。适合正在构建推理路由、多模型策略或成本优化方案的工程师阅读。

vllm.ai · 14 min · AI Engineering · Cost Optimization · LLM · Open Source · Orchestration
06:00

Claude Code 循环模式:从手动检查到定时任务的工程化指南

Getting started with loops

本文是 Claude Code 官方发布的工程指南,系统梳理了四种 agent 循环模式及其适用场景。Turn-based 循环适合探索性短任务,用户可通过编写 SKILL.md 将手动验证步骤编码为自动检查,例如要求 Claude 启动 dev server、截图并检查浏览器控制台。Goal-based 循环通过 /goal 命令设定确定性终止条件(如 Lighthouse 评分 ≥90),并强制 Claude 在达到阈值前持续迭代。Time-based 循环由 /loop(本地间隔轮询)和 /schedule(云端定时触发)支持,适合处理 PR review、CI 失败修复等重复性依赖外部系统的工作。Proactive 循环组合 /schedule、/goal、动态工作流和 auto mode,构建面向长期运行任务的生产线。文章还讨论了代码质量维护、token 用量管理策略,强调用脚本替代推理、用小模型处理例行任务、用 /usage 命令监控各技能和子 agent 的成本。适合正在将 Claude Code 嵌入日常开发流程的工程师。