爱折腾的工程师

未来的你会感谢现在努力的自己

把 Agent 真正发上线：Google Cloud《生产级 AI Agent 开发者指南》深读

Google Cloud 把 Agent 工程化压缩成 5 个阶段：定义、工具互操作、上下文工程、测试评估、生产部署。本文按这条骨架展开，但不复述原文——逐节追问『传统工程范式为什么失效』，给出可量化的判断标准与真实工程场景，并把 Trajectory 评估、Sandbox→Canary→Production 三阶段发布单拎出来重点解读。文末附给上线者的落地清单与按角色分流的学习路径地图。

Posted by iceyao on Saturday, May 23, 2026

把 HTML 当画布：Anthropic 内部如何用一份单页文件，把 Claude Code 从「自动写」拉回「同步在线」

Thariq Shihipar 在 Anthropic 官方博客的最新一篇《The unreasonable effectiveness of HTML》给出了一个反常识的工作流：当 Agent 越来越能自主跑完一切，他反而几乎完全停用 Markdown，所有产物——规划、评审、原型、报告、一次性编辑器——一律走 HTML。本文把原文压成五大能力维度 + 五类工作流场景矩阵，再延伸出三条不那么舒服的判断：一次性编辑器打破了软件必须复用的工程直觉、「总是以导出结束」是反馈循环收紧的关键、token 不是 HTML 的成本，注意力才是。

Posted by iceyao on Friday, May 22, 2026

百万行 monorepo 里的 Claude Code：Anthropic 官方拆解的 7 个扩展点与 3 大部署模式

Anthropic 5/14 发布的《How Claude Code works in large codebases》给工程效能团队提了一个被严重低估的判断：Claude Code 在大代码库里的上限不是模型决定的，而是 Harness 决定的。本文按『是什么 → 为什么这么设计 → 怎么落地 → 别踩的坑』重新组织，逐一解读 CLAUDE.md / Hooks / Skills / Plugins / LSP / MCP / Subagents 七个扩展点，三大配置模式，以及一份 10 步起步路线图。

Posted by iceyao on Sunday, May 17, 2026

把『基于 URL 写一篇博文』这条 prompt 救回来：一个 Claude Skill 的设计、打造与三轮评测实录

为什么「基于这个 URL 写一篇博文」这条 prompt 几乎注定塌？prompt-optimizer skill 用 5 维度心智模型 + 5 步工作流把它救回来。本文先讲清楚它从概念构思到定型上线的 4 阶段开发过程、设计动机和实现原理，再把一份完整的双轨评测（质量评测 21/21 vs 4/8、触发评测三轮迭代 F1 0.90 → 1.00、全样本 3/3 全票一致）拆给你看，附 8 张数据信息图。读完你会知道——评测 skill 不只是看分数，更是看分数停在 100% 之后还有什么可以改。

Posted by iceyao on Saturday, May 16, 2026

10 人独角兽不再是故事：拆解 Anthropic《创始人手册》里的 AI-native 创业新路线

Anthropic 把 2026 年创业生命周期重映射成 Idea / MVP / Launch / Scale 四阶段，并把『创始人=IC』改写为『创始人=Agent 编排者』。本文从原文 36 页 PDF 中提炼出可执行的策略、容易踩的坑，并结合 Carta Healthcare、Anything、Cogent 等 9 家真实公司的做法，给出图文并茂的深度解读。

Posted by iceyao on Friday, May 15, 2026