日刊 · 2026-06-06 — Glean

2026-06-06 · 周六 3 条

06:00

大模型真正拉开差距的地方在预训练之后：一条后训练链路的完整拆解

What Really Differentiates LLMs Happens After Pretraining: A Full Post-Training Pipeline Breakdown

这篇长文系统梳理了大模型训练的全链路，核心观点是：2026年模型效果的真正差距并不在预训练阶段，而在后训练、评测、奖励、Agent训练与蒸馏等「后半段」。文章以工序化的方式拆解了从预训练底座到数据配方、系统架构、四阶段后训练流水线（SFT冷启动—GRPO推理RL—拒绝采样微调—对齐RL）、Grader/Reward设计、Agent训练（包括PARL架构与Meta-Harness优化）、蒸馏部署等完整流程。其中着重分析了DeepSeek-R1的公开配方、GRPO相比PPO的工程优势、PRM与ORM的优劣、以及Agent从优化答案扩展到优化环境Harness程序的趋势。适合需要理解大模型能力来源于哪些具体工程环节的系统/数据/工具工程师。

tw93.fun · 27 min · Agents · LLM · Performance

06:00

AI 放大的是输出，不是输入：如何用 /learn 流程深入学习一个技术领域

AI Amplifies Output, Not Input: My /learn Workflow for Deep Technical Dives

作者分享了在 AI 时代深入学习一个技术领域的个人方法：以输出为导向，将学习过程组织为‘收集资料—筛选精读—写大纲—填充初稿—AI 辅助收紧结构—自读定稿’的流水线。核心观点是 AI 的价值不在于替你总结，而在于放大你已有的判断与输出动作。文中以近期研究大模型训练流程为例，展示了如何用开源工具集 Waza 中的 /learn 技能把这一过程工业化。适合对‘AI 时代如何保持学习深度’有困惑的工程师阅读。

tw93.fun · 2 min · AI · Framework

06:00

用 Claude 和 Obsidian 搭建 AI 第二大脑：从零到可用的完整教程

Building an AI Second Brain with Claude and Obsidian: The Complete Tutorial

这是一份实操教程，教你如何让 Claude 连接 Obsidian 笔记库，构建一个能基于你自己的笔记进行检索、推理和综合的 AI 知识引擎。文章给出了具体的文件夹结构（PARA 法）、为 AI 优化笔记的设计原则、三种 Claude 接入方案（Project 上传、Claude Code 直读、MCP 服务），以及五个立即可用的自动化工作流（周报、研究综合、想法连接、知识盲区发现、每日简报）。适用愿意花时间建立个人知识库的开发者、研究者或知识工作者。

x.com · 13 min · Agents · AI · Framework

每天拾几条。

大模型真正拉开差距的地方在预训练之后：一条后训练链路的完整拆解

AI 放大的是输出，不是输入：如何用 /learn 流程深入学习一个技术领域

用 Claude 和 Obsidian 搭建 AI 第二大脑：从零到可用的完整教程