Glean 拾遗
最近收录

5 条 · 按时间

06-12

2026 年如何构建真正可用的 AI Agent:从认知模型到代码实操

本文系统地拆解了构建实用 AI Agent 的核心架构与工程实践。作者首先厘清了聊天机器人、AI Agent 与 Agentic AI 的边界,指出真正 Agent 的本质是持续执行直到目标达成的循环系统,而非一次性问答。文章深入阐述了 Agent 运行的 ReAct 循环(思考-行动-观察-反思),并分解出 Agent 的五大基石:LLM 大脑、工具(手)、记忆(短期与长期)、自校正回路及验证环节。作者以“构建一个挖掘健身领域痛点创业想法的研究 Agent”为例,展示了从设定目标、赋予工具、引入循环、构建记忆到增加批评 Agent 的完整构建步骤,并附带了可直接使用的 5 种 Agent 系统提示。文章还总结了导致 Agent 失败的 6 个核心原因(如缺乏记忆、无停止条件等),并推荐了 Claude Code、LangGraph、MCP 等当前技术栈。适合希望从 Prompt 工程转向 Agent 系统工程的一线开发者阅读,提供从 50 行 Python 代码起步的周末实践路线图。

x.com · 21 min · Agent Architecture · AI Agents · AI Engineering
06-11

Headless Tools:让智能体直接在浏览器和桌面应用里执行动作

这篇文章提出了一种名为 Headless Tools 的新机制,解决了智能体(Agent)无法直接操控用户端运行环境的问题。 作者指出,当前大多数 Agent 工具运行在服务端,可以调用 API,但无法访问浏览器、应用状态或设备能力(如剪贴板、定位、本地存储)。Headless Tools 将客户端能力(如 navigator.geolocation、IndexedDB、应用内导航)封装为模型可以调用的标准工具,模型感知不到工具实际执行的位置,服务端和客户端负责协调,使 Agent 能直接作用于用户所在的浏览器或桌面应用。文章提供了 TypeScript 代码示例,并展示了在 Slidev 演示框架和浏览器本地记忆中的具体应用。这一设计同时带来了隐私优势,因为敏感数据可以默认留在本地,无需发送到后端。本文适合需要构建深度集成前端应用的 Agent 系统的工程师阅读,特别是那些在 Figma 插件、富文本编辑器或桌面工具中嵌入 AI 能力的团队。

x.com · 7 min · AI Agents · AI Engineering · Browser
06-10

AI 代理技能:跨平台社交搜索与 30 天舆情简报

/last30days 是一个 AI 代理技能,能将 Reddit、X、YouTube、TikTok、Hacker News 等多个社交平台的最新内容聚合为一份 30 天内的舆情简报。它通过实体预解析(pre-research)智能识别关键人物、社区和话题,并行搜索并依据真实用户的点赞、转发和投入(而非 SEO 排名)进行评分排序,最终由 AI 合成有引用的深度摘要。项目以 MIT 开源,支持 Claude Code 等 50+ 代理框架,适合需要在会前快速了解某人或某话题最新动态的工程师、产品经理和研究者。

github.com · 27 min · AI Agents · Open Source · Social Media
06-10

Claude Fable 5 实战:用自校正循环和跨会话记忆打磨代理任务

作者分享了使用 Anthropic 的 Claude Fable 5 模型提升代理工作效能的两个实战方向:自校正循环和跨会话记忆。在自校正循环实验中,作者用 Parameter Golf——一个要求在 16MB 模型体积、8xH100 GPU 上 10 分钟内训练最佳模型的公开挑战——比较了 Fable 5 与 Opus 4.7 的表现。通过 Claude Managed Agents 提供的 Outcomes 原语,由独立验证子代理根据九项可检查标准评分,Fable 5 对训练管线的改进幅度约为 Opus 4.7 的 6 倍。Fable 5 更倾向于做结构性改动,并在遇到量化性能回退时展现出韧性,而 Opus 4.7 则停留在调整标量超参数的模板上。在记忆实验中,作者使用 Continual Learning Bench 1.0 中的 SQL 问答任务,对比了 Fable 5、Opus 4.7 和 Sonnet 4.6 利用文件系统跨会话记忆的能力。Sonnet 4.6 仅记录失败和未验证猜测,Opus 4.7 能创建带不确定性标记的 schema 参考但验证覆盖率中位数仅 17%;Fable 5 最强运行中验证覆盖率达 73% 并将学习提炼为通用规则。文章适合关注代理架构设计和模型能力边界的工程师阅读。

x.com · 5 min · Agent Architecture · AI Agents · AI Engineering
06-09

循环工程:让代码智能体在后台自主运行,而你设计的是循环本身

本文来自 Addy Osmani 对编码智能体未来工作模式的深度观察。核心观点是,与编码智能体交互的方式正从直接的提示词工程转向循环工程:工程师不再亲自写每一步提示词,而是设计一个包含定时自动化、并行工作树、项目技能、连接器插件和子智能体检查者的闭环系统,让系统自己去发现任务、分配工作、验证结果。文章详细拆解了这五个构建块及其在 Claude Code 和 Codex 中的对应实现,并强调了循环运行中必须持续关注验证、理解债务和认知舒适区的陷阱。适合正在探索如何将 AI 编码工具从一次性助手升级为持续后台工作者的资深工程师,尤其是那些关心代码质量、认知负担和成本控制的团队。

x.com · 14 min · Agent Architecture · AI Agents · AI Engineering