Glean 拾遗
日刊 · 时间线

每天拾几条。

2026-06-01 · 周一 5 条
← 05-31
日历 ▾
2026 · 06
MoTuWeThFrSaSu 123456789101112131415161718192021222324252627282930
有日刊 今天
06:00

Andrej Karpathy 亲述:99% 的 AI 用户不知道的 7 个基本功

Andrej Karpathy says 99% of AI users miss 7 basics. Full breakdown.

OpenAI 联合创始人、前 Tesla AI 负责人 Andrej Karpathy 认为,多数 AI 用户的瓶颈不是模型或提示词,而是缺少一套围绕模型构建的系统。本文拆解了他的 7 条实操铁律:不要纠结“魔法提示词”,必须喂足上下文;认真定制 CLAUDE.md;用 /raw、/wiki、配置文件搭建三层记忆结构;把每次满意的输出永久保存为引用页;长项目必需 index.md 和 log.md;把 AI 当成无品位的超级实习生,用小步验证循环;以及一句将研究输出转化为可导航 HTML 的指令。适合总在调提示词却拿不到稳定产出的工程师,用半天搭好这套基础,AI 才能真正为你工作。

x.com · 8 min · AI · LLM
06:00

Claude 子代理 vs 智能体团队:多智能体架构该如何选

Claude Subagents vs. Agent Teams, explained

文章对比了 Claude 多智能体系统的两种范式:子代理(sub-agents)是即发即忘的短时工作单元,拥有独立上下文与工具,仅返回压缩结果,适用于可极致并行的独立任务;智能体团队(agent teams)则是长期运行、可直连通信、通过共享任务列表协调的协作模式,适合需要持续协商的场景。作者给出了基于上下文边界的设计原则、五种常用编排模式,并明确了何时不应使用多智能体系统:当任务简单或上下文需要频繁共享时,单智能体往往更优。文中包含 Python SDK 示例与失败模式分析,面向正在构建或评估智能体系统的工程师。

x.com · 11 min · Agents · AI · LLM
06:00

Claude Code 自主运行完全指南:/goal、/loop、/schedule 与 Stop Hook

The Complete Guide to /goal, /loop, /schedule & Stop Hooks in Claude Code

本文详述了 Claude Code 四种让 AI 脱离手动引导的自主运行命令。/goal 设定完成条件,每轮由轻量模型自动评估是否达成,直至条件满足;/loop 按固定时间间隔循环执行;/schedule 创建独立于会话的后台定时任务;Stop Hook 则支持自定义脚本或条件判断,实现“测试不绿不停止”。文中给出了明确的模板、好/坏条件示例、与 Auto 模式配合实现完全无人值守的方案,并对比了各命令的适用场景,帮助开发者从“每步提示”转向“设定即忘”的工作流。

x.com · 9 min · Agents · AI
06:00

Claude Code 的 /goal 命令:告别手动“继续”,让 AI 自主完成编码任务

Claude Code /goal: Autonomous Task Completion Without Babysitting

Claude Code 新增的 /goal 命令可以让 AI 助手持续运行,直到满足你设定的完成条件,无需反复输入“continue”。作者详解其工作原理:每轮结束后,一个轻量评价模型(默认 Claude Haiku)自动检查对话记录,若目标未达成则立即启动下一轮。成功的关键在于写出具体、可衡量且能从输出中验证的目标(例如“所有测试通过且 lint 干净”)。文章还给出了项目准备建议(创建 CLAUDE.md、配置 hooks、开启 Auto Mode),并警告模糊的目标会导致 token 浪费和评价幻觉。最后对比了 /goal 与 /loop、stop hooks 的适用场景。适合所有希望摆脱 AI 编码中“逐轮监督”的开发者。

x.com · 5 min · Agents · AI · LLM
06:00

用 Codex 构建自改进税务 AI:生产反馈闭环实践

Building self-improving tax agents with Codex

OpenAI 与 Thrive Holdings 联合为希腊克里特岛会计网络开发 Tax AI,基于 Codex 驱动自改进循环。系统处理 7,000 份税表,准确率达 97%,吞吐量提升 50%,将一位高级会计师的税务准备时间从 180 小时降至 15 小时。核心设计三支柱:从业者反馈、生产轨迹(从原始文件到最终申报的结构化流程)、Codex 迭代循环。以租赁房产表格为例,详细展示了从业者修正如何转化为评估目标,再由 Codex 分析根因并提出补丁。适合在专家知识密集型领域构建自进化代理的团队。

openai.com · 15 min · Agents · AI · Performance