Glean 拾遗
最近收录

2 条 · 按时间

06-09

设计一个自行驱动 Agent 的多步任务循环

本文提出了一个让 AI Agent 自主完成多步任务的循环架构,核心在于用代码构建一个自动化的提示生成系统,而非手动编写单个提示。文章详细拆解了该循环的五个组成部分:定义验收标准(done check)、从状态构建上下文而非每次手写指令、执行操作并捕获所有输出、将失败结果作为反馈闭合到下一轮提示中,以及设置硬性停止条件(最大轮次、成本上限)。作者通过一个修复登录Bug的实例展示了循环如何运行,并指出实际开销来自多轮调用,而非单次代码生成,因此止损条件至关重要。此外,将反复出现的操作封装为可复用技能是提升长期价值的关键,而初学者常犯的错误包括缺乏退出条件、手动干预提示和丢弃失败输出。适合希望从单次提示工程转向构建Agent控制流的开发者阅读。

x.com · 18 min · Agent Architecture · Agents · AI Engineering
06-07

2026年6月第一周AI快讯:Claude限额翻倍、SpaceX IPO、微软模型数据翻车

本文汇总了6月第一周10条AI与科技行业动态。MiniMax M3大模型发布,以0.6美元/百万token的价格在编程跑分上超越GPT-5.5,但独立验证尚未出炉。DeepSeek完成约74亿美元首轮外部融资,宇树科技以73天闪电过会。Kimi Work、Coze 3.0与Qwen3.7-Plus在同一周发力Agent领域。豆包宣布收费,基础版永久免费。ChatGPT月活突破10亿,Codex推出Sites和岗位插件。Anthropic将Claude Cowork限额翻倍,并发布了Claude已撰写自家80%代码的报告,同时秘密提交IPO。英伟达在Computex 2026发布集成ARM CPU的RTX Spark超级芯片。SpaceX定于6月12日上市,谷歌披露了一份9.2亿美元/月的算力租用合同。微软自研推理模型MAI-Thinking-1发布仅3天,其声称的“干净数据”便被发现包含242亿页Common Crawl数据,同时GitHub Copilot转为按量计费后,部分开发者月账单飙升至3000美元。文章是典型的行业信息简报,适合需要快速了解一周重大技术动态的工程师和从业者。

mp.weixin.qq.com · 7 min · AI Engineering · AI Industry · Cost Optimization