Glean 拾遗
日刊 · 时间线

每天拾几条。

2026-06-07 · 周日 4 条
← 06-06
日历 ▾
2026 · 06
MoTuWeThFrSaSu 123456789101112131415161718192021222324252627282930
有日刊 今天
06-08 →
13:12

2026年6月第一周AI快讯:Claude限额翻倍、SpaceX IPO、微软模型数据翻车

Weekly AI Roundup: Claude Limits Doubled, SpaceX IPO, Microsoft Model Data Contradiction

本文汇总了6月第一周10条AI与科技行业动态。MiniMax M3大模型发布,以0.6美元/百万token的价格在编程跑分上超越GPT-5.5,但独立验证尚未出炉。DeepSeek完成约74亿美元首轮外部融资,宇树科技以73天闪电过会。Kimi Work、Coze 3.0与Qwen3.7-Plus在同一周发力Agent领域。豆包宣布收费,基础版永久免费。ChatGPT月活突破10亿,Codex推出Sites和岗位插件。Anthropic将Claude Cowork限额翻倍,并发布了Claude已撰写自家80%代码的报告,同时秘密提交IPO。英伟达在Computex 2026发布集成ARM CPU的RTX Spark超级芯片。SpaceX定于6月12日上市,谷歌披露了一份9.2亿美元/月的算力租用合同。微软自研推理模型MAI-Thinking-1发布仅3天,其声称的“干净数据”便被发现包含242亿页Common Crawl数据,同时GitHub Copilot转为按量计费后,部分开发者月账单飙升至3000美元。文章是典型的行业信息简报,适合需要快速了解一周重大技术动态的工程师和从业者。

mp.weixin.qq.com · 7 min · AI Engineering · AI Industry · Cost Optimization · Developer Tools · LLM
06:01

构建 Claude Code 的教训:提示缓存就是一切

Lessons from Building Claude Code: Prompt Caching Is Everything

Anthropic 工程师分享 Claude Code 中优化提示缓存的实际经验。提示缓存基于前缀匹配,缓存从请求头到每个 breakpoint 的内容,因此 prompt 各部分的顺序至关重要:遵循“静态在前、动态在后”原则,能最大化跨会话的缓存命中。文章给出多条反直觉教训:用消息传递更新信息而非修改系统提示;不要在会话中切换模型或增减工具,这会立刻导致缓存全部失效;压缩(compaction)时复用父会话前缀避免缓存丢失。每条建议都附带具体实现策略(如 system-reminder 标签、EnterPlanMode/ExitPlanMode 作为工具、defer_loading 机制)。适合正在构建长运行 Agent 产品的工程师参考。

x.com · 8 min · Agents · LLM · Performance
06:01

让Claude Code更懂你:写好CLAUDE.md的8条实战经验

8 proven tips for crafting a CLAUDE.md that truly understands your project

本文总结了8条通过优化CLAUDE.md让Claude Code更契合项目的实战经验,包括:将文件长度控制在200行内以避免信息过载;用“禁止引入的库”清单替代仅列出技术栈;制定可操作、可验证的编码规则(如使用named export、禁用any类型);将CLAUDE.md作为信息路由而非知识库;在敏感模块(如认证、支付)本地化配置;通过Hook强制执行而非依赖记忆;用MEMORY.md实现跨会话知识迁移;以及预先定义工作风格以减少重复指令。这些原则源自一线实践,附带具体代码示例和对比,适用于所有使用AI编程助手的工程师。

x.com · 5 min · Agents · AI · LLM
06:01

为什么你的AI代理被工具淹没(以及代码模式如何拯救它)

Why Your AI Agent Is Drowning in Tools (And How Code Mode Saves It)

文章指出AI代理通过MCP集成大量工具时,容易陷入上下文膨胀和工具幻觉。50+工具可能占据5-7%的上下文窗口,导致多工具混淆。传统方案包括代理端过滤和MCP端精简,但各有局限。代码模式通过让LLM编写代码来搜索和执行工具,大幅减少令牌消耗,支持复杂控制流,同时引入调试和基础设施成本。以Cloudflare及Anthropic的实现为例,强调核心在于回归用例,维护合理工具集,而非追求魔数。

engineering.leanix.net · 7 min · Agents · Cloudflare · LLM