爱折腾的工程师

未来的你会感谢现在努力的自己

CodeRabbit 如何用 Claude 构建 Agent 编排系统:从隐性知识鸿沟到规划驱动的代码生成

CodeRabbit 每周审查 200 万个 PR,他们发现 AI 生成代码最常见的失败不是编译错误,而是方向偏离。本文解析其 Agent 编排系统的核心设计:在代码生成之前插入规划层,通过 Opus/Sonnet/Haiku 多模型路由与评估体系闭环,将模糊需求转化为精准执行计划。

用 LLM 保护源代码安全:Anthropic 六步闭环实战指南

从威胁建模到自动修复,瓶颈已从发现转移到验证与修复

引言 模型能力正在快速且不均匀地进化。Anthropic 安全团队在与多个企业合作扫描开源软件的过程中,截至 2026 年 5 月 22 日已披露 1,596 个漏洞,但其中仅

把 HTML 当画布:Anthropic 内部如何用一份单页文件,把 Claude Code 从「自动写」拉回「同步在线」

Thariq Shihipar 在 Anthropic 官方博客的最新一篇《The unreasonable effectiveness of HTML》给出了一个反常识的工作流:当 Agent 越来越能自主跑完一切,他反而几乎完全停用 Markdown,所有产物——规划、评审、原型、报告、一次性编辑器——一律走 HTML。本文把原文压成五大能力维度 + 五类工作流场景矩阵,再延伸出三条不那么舒服的判断:一次性编辑器打破了软件必须复用的工程直觉、「总是以导出结束」是反馈循环收紧的关键、token 不是 HTML 的成本,注意力才是。

百万行 monorepo 里的 Claude Code:Anthropic 官方拆解的 7 个扩展点与 3 大部署模式

Anthropic 5/14 发布的《How Claude Code works in large codebases》给工程效能团队提了一个被严重低估的判断:Claude Code 在大代码库里的上限不是模型决定的,而是 Harness 决定的。本文按『是什么 → 为什么这么设计 → 怎么落地 → 别踩的坑』重新组织,逐一解读 CLAUDE.md / Hooks / Skills / Plugins / LSP / MCP / Subagents 七个扩展点,三大配置模式,以及一份 10 步起步路线图。

把『基于 URL 写一篇博文』这条 prompt 救回来:一个 Claude Skill 的设计、打造与三轮评测实录

为什么「基于这个 URL 写一篇博文」这条 prompt 几乎注定塌?prompt-optimizer skill 用 5 维度心智模型 + 5 步工作流把它救回来。本文先讲清楚它从概念构思到定型上线的 4 阶段开发过程、设计动机和实现原理,再把一份完整的双轨评测(质量评测 21/21 vs 4/8、触发评测三轮迭代 F1 0.90 → 1.00、全样本 3/3 全票一致)拆给你看,附 8 张数据信息图。读完你会知道——评测 skill 不只是看分数,更是看分数停在 100% 之后还有什么可以改。