日刊 · 2026-06-30 — Glean

2026-06-30 · 周二 2 条

06:01

研究者的可训练技能栈：从挑选问题到刻意犯错

how to be good at research

本文由 @itsreallyvivek 撰写，提出研究能力并非天赋，而是一套可被刻意训练的次级技能栈。核心论点包括：挑选自己真正关心的问题以制造原创性，升级信息源（读旧材料、跨领域、读原文而非线程摘要）以打破共识，将想法写下来以暴露认知漏洞，通过脚本化工具和低代价实验收紧反馈循环，直接盯着失败案例而非只看损失曲线，有目的地游走多个子领域以找到个人独特性优势，并找到能告诉你想法很糟糕的同伴。文章大量引用 Hamming、Schulman、Feynman、Darwin、Karpathy、Andrew Ng 等人的具体方法论，强调可操作的实践（如预测实验结果、过拟合单个 batch、手动分析百个失败案例），而非抽象建议。适合希望从表面模仿转向实质生产力的研究工程师和博士生，尤其适用于机器学习与系统工程交叉领域的一线实践者。

x.com · 10 min · AI Engineering · Career Advice · Experiment Design · Research Methodology

06:01

AI Agent 上下文工程完全手册：为什么你的 Agent 在第 15 步开始变糟

Context Engineering for AI Agents: The Complete Playbook

本文系统阐述了上下文工程在构建 AI Agent 中的核心地位，指出 Agent 行为退化往往不是模型问题，而是上下文窗口管理不当。文章指出，Agent 的上下文窗口如同 RAM，随着工具调用、检索结果和对话历史累积，模型注意力会衰减，出现“中间丢失”和上下文腐败。作者给出了四大策略：Write（持久化信息到外部）、Select（按需检索）、Compress（压缩上下文）、Isolate（隔离不同任务的上下文），并详细分析了 4 种失败模式（中毒、分心、混淆、冲突）。文章还提供了具体数据：Chroma 基准测试表明所有模型在输入长度增加时性能连续下降，RAG‑MCP 将工具选择准确率从 14% 提升至 43% 且令牌用量减半，KV‑cache 缓存命中可使成本降低 10 倍。最后给出了一个在 7 小时内向 Rust 代码库提交约 35,000 行代码的实战工作流，适合所有需要构建可靠生产级 Agent 的工程师阅读。

x.com · 21 min · Agents · AI Engineering · Context Engineering · KV‑Cache · Tool Selection

每天拾几条。

研究者的可训练技能栈：从挑选问题到刻意犯错

AI Agent 上下文工程完全手册：为什么你的 Agent 在第 15 步开始变糟