Glean 拾遗
日刊 · 时间线

每天拾几条。

2026-06-30 · 周二 2 条
← 06-29
日历 ▾
2026 · 06
有日刊 今天
06:01

研究者的可训练技能栈:从挑选问题到刻意犯错

how to be good at research

本文由 @itsreallyvivek 撰写,提出研究能力并非天赋,而是一套可被刻意训练的次级技能栈。核心论点包括:挑选自己真正关心的问题以制造原创性,升级信息源(读旧材料、跨领域、读原文而非线程摘要)以打破共识,将想法写下来以暴露认知漏洞,通过脚本化工具和低代价实验收紧反馈循环,直接盯着失败案例而非只看损失曲线,有目的地游走多个子领域以找到个人独特性优势,并找到能告诉你想法很糟糕的同伴。文章大量引用 Hamming、Schulman、Feynman、Darwin、Karpathy、Andrew Ng 等人的具体方法论,强调可操作的实践(如预测实验结果、过拟合单个 batch、手动分析百个失败案例),而非抽象建议。适合希望从表面模仿转向实质生产力的研究工程师和博士生,尤其适用于机器学习与系统工程交叉领域的一线实践者。

06:01

AI Agent 上下文工程完全手册:为什么你的 Agent 在第 15 步开始变糟

Context Engineering for AI Agents: The Complete Playbook

本文系统阐述了上下文工程在构建 AI Agent 中的核心地位,指出 Agent 行为退化往往不是模型问题,而是上下文窗口管理不当。文章指出,Agent 的上下文窗口如同 RAM,随着工具调用、检索结果和对话历史累积,模型注意力会衰减,出现“中间丢失”和上下文腐败。作者给出了四大策略:Write(持久化信息到外部)、Select(按需检索)、Compress(压缩上下文)、Isolate(隔离不同任务的上下文),并详细分析了 4 种失败模式(中毒、分心、混淆、冲突)。文章还提供了具体数据:Chroma 基准测试表明所有模型在输入长度增加时性能连续下降,RAG‑MCP 将工具选择准确率从 14% 提升至 43% 且令牌用量减半,KV‑cache 缓存命中可使成本降低 10 倍。最后给出了一个在 7 小时内向 Rust 代码库提交约 35,000 行代码的实战工作流,适合所有需要构建可靠生产级 Agent 的工程师阅读。