
引言
2026 年 4 月,Warp 在 GitHub 开源了其 100 万行 Rust 代码库,一个终端模拟器获得了近 6 万颗星。同月,Happy——一个让你从手机远程控制 Claude Code 的工具——在 Google Play 上评分 4.9。同月,OpenAI 为竞品 Claude Code 发布了官方插件,让 Codex 直接给 Claude Code 打下手。
这三件事放在一起,指向一个正在发生的变化:编程工具不再围绕”人怎么写代码”设计,而是围绕”Agent 怎么写代码、人怎么管 Agent”设计。
上一篇文章讨论了 AI 编程范式的演进——从 Vibe Coding 到 Agent 模式,关注的是”人怎么用 AI”。这篇文章关注另一个维度:AI 成为编程主体之后,围绕 AI 的工具生态正在经历怎样的进化?
这不是一个AI工具的罗列。这是对后 AI 编程时代工具走向的一次梳理——编辑器和终端正在殊途同归,移动端正在从噱头变成必备品,多 Agent 协作正在从社区 Hack 变成基础设施。每一股力量都在指向同一个方向。
阅读全文 »
引言

2026 年 3 月 31 日,Anthropic 在发布 Claude Code v2.1.88 时,因构建配置错误将一个 59.8MB 的 JavaScript Source Map 文件一同打包到了 npm 仓库。这个 cli.js.map 未经任何混淆,包含了完整的 TypeScript 源码——512,000 行代码,1,900 个文件。安全研究员 Chaofan Shou 最先发现了这个问题,消息传出后,GitHub 上迅速出现了多个镜像仓库,其中 instructkr/claude-code 在数小时内积累了数万颗星。Anthropic 随即发送 DMCA 删除请求,但代码早已四处传播。
事件经过就这些,不再赘述。本文关注的是另一个问题:这 51 万行代码到底揭示了什么工程真相?
本文逐层拆解一个生产级 AI Agent 的内部构造:代码怎么组织的,核心循环怎么运转的,48 把工具怎么调度的,权限怎么设防的,记忆怎么设计的,多 Agent 怎么编排的,Feature Flag 背后藏着什么。
所有引用都来自实际源码文件、函数签名和行号。
阅读全文 »
引言

在 上一篇关于 Harness Engineering 的文章 中,我们梳理了 Harness 的概念框架——约束、告知、验证、纠正四个支柱,以及从 Prompt Engineering 到 Context Engineering 再到 Harness Engineering 的演进路径。那篇文章回答了”Harness 是什么”和”为什么需要 Harness”的问题。
本文要回答的是更深一层的问题:一个具体的 Harness 内部是怎么运转的。
2026 年 3 月,Anthropic Labs 团队的 Prithvi Rajasekaran 发表了一篇关于长时间运行应用开发 Harness 的深度文章。文章描述了一个受 GAN(生成对抗网络)启发的多 Agent 架构:生成器构建代码,评估器评审质量,两者形成对抗式反馈循环。这个架构在长达数小时的自主编码会话中,成功输出了包含 16 个功能的完整全栈应用。
下面我们结合 Anthropic 的设计思路和我们自研框架 CAF 的实际代码,对 Plan→Contract→Build→Evaluate 迭代循环做逐层拆解,重点看循环控制的工程细节:Agent 隔离、上下文健康管理、制品流转、评分解析的防御性设计。
阅读全文 »
引言

最近在用 AI Coding 开发智能体项目 Common Agent Framework (CAF),整体效率提升很明显,代码部分完全可以交付给AI完成——但有一点始终让我无法真正的离开:不停地点 approve。读取文件、运行测试、查看 Git 状态,每一步都需要手动确认。这本是合理的安全设计,但在你足够了解风险边界的场景下,它更像是一种仪式感大于实际意义的操作。
或者一个极端情况,到后来可能已经不怎么细看看具体内容了,反正点就是了。问题在于,当安全提示变得频繁且大部分无害时,人会形成肌肉记忆,这种”假装把关”比没有安全机制更危险。
2026 年 3 月 24 日 Anthropic 宣布了 Claude Code 的 Auto Mode。它的思路是:让 AI 先判断哪些操作可以放行,而不是把每个决定都抛给用户。
阅读全文 »
引言

这段时间相信大家都在乐此不疲地折腾 OpenClaw,寻找各种场景。
有人在用它自动整理收件箱,有人在让它自动写代码,还有人在睡觉时让它谈成了 4200 美元的汽车折扣。
OpenClaw 有个 Cron 技能——你可以让 Agent 定时自动运行,完全不需要你介入。
于是我想试试:能不能让 OpenClaw 自己维护一个 GitHub 仓库?
从 3 月 21 日启动到现在,这个 Agent 已经独立完成了 35+ 个提交,生成了 20+ 篇文章,涵盖框架对比、MCP 深度解析、Agent 论文解读、工程实践指南……
而我,除了初始的几轮对话设定规则,完全没有碰过这个项目。
今天想聊聊这个实验的过程和观察。
阅读全文 »