Glean 拾遗
日刊 · 时间线

每天拾几条。

2026-06-06 · 周六 3 条
← 06-05
日历 ▾
2026 · 06
MoTuWeThFrSaSu 123456789101112131415161718192021222324252627282930
有日刊 今天
06-07 →
06:00

大模型真正拉开差距的地方在预训练之后:一条后训练链路的完整拆解

What Really Differentiates LLMs Happens After Pretraining: A Full Post-Training Pipeline Breakdown

这篇长文系统梳理了大模型训练的全链路,核心观点是:2026年模型效果的真正差距并不在预训练阶段,而在后训练、评测、奖励、Agent训练与蒸馏等「后半段」。文章以工序化的方式拆解了从预训练底座到数据配方、系统架构、四阶段后训练流水线(SFT冷启动—GRPO推理RL—拒绝采样微调—对齐RL)、Grader/Reward设计、Agent训练(包括PARL架构与Meta-Harness优化)、蒸馏部署等完整流程。其中着重分析了DeepSeek-R1的公开配方、GRPO相比PPO的工程优势、PRM与ORM的优劣、以及Agent从优化答案扩展到优化环境Harness程序的趋势。适合需要理解大模型能力来源于哪些具体工程环节的系统/数据/工具工程师。

tw93.fun · 27 min · Agents · LLM · Performance
06:00

AI 放大的是输出,不是输入:如何用 /learn 流程深入学习一个技术领域

AI Amplifies Output, Not Input: My /learn Workflow for Deep Technical Dives

作者分享了在 AI 时代深入学习一个技术领域的个人方法:以输出为导向,将学习过程组织为‘收集资料—筛选精读—写大纲—填充初稿—AI 辅助收紧结构—自读定稿’的流水线。核心观点是 AI 的价值不在于替你总结,而在于放大你已有的判断与输出动作。文中以近期研究大模型训练流程为例,展示了如何用开源工具集 Waza 中的 /learn 技能把这一过程工业化。适合对‘AI 时代如何保持学习深度’有困惑的工程师阅读。

tw93.fun · 2 min · AI · Framework
06:00

用 Claude 和 Obsidian 搭建 AI 第二大脑:从零到可用的完整教程

Building an AI Second Brain with Claude and Obsidian: The Complete Tutorial

这是一份实操教程,教你如何让 Claude 连接 Obsidian 笔记库,构建一个能基于你自己的笔记进行检索、推理和综合的 AI 知识引擎。文章给出了具体的文件夹结构(PARA 法)、为 AI 优化笔记的设计原则、三种 Claude 接入方案(Project 上传、Claude Code 直读、MCP 服务),以及五个立即可用的自动化工作流(周报、研究综合、想法连接、知识盲区发现、每日简报)。适用愿意花时间建立个人知识库的开发者、研究者或知识工作者。

x.com · 13 min · Agents · AI · Framework