爱折腾的工程师

未来的你会感谢现在努力的自己

Claude Code 指令路由指南:CLAUDE.md、Rules、Skills、Subagents 与 Hooks 怎么选

别再把所有要求都塞进 CLAUDE.md:用加载时机、压缩存续与执行权威设计可维护的 Agent 配置

基于 Anthropic 官方文章 Steering Claude Code 的中文技术解读。文章以加载时机、上下文压缩后的存续方式和执行权威为三条主轴,对比 CLAUDE.md、Rules、Skills、Subagents、Hooks、Output styles 与 append-system-prompt,并通过一个臃肿 CLAUDE.md 的迁移案例给出团队可落地的选型方法。

把『基于 URL 写一篇博文』这条 prompt 救回来:一个 Claude Skill 的设计、打造与三轮评测实录

为什么「基于这个 URL 写一篇博文」这条 prompt 几乎注定塌?prompt-optimizer skill 用 5 维度心智模型 + 5 步工作流把它救回来。本文先讲清楚它从概念构思到定型上线的 4 阶段开发过程、设计动机和实现原理,再把一份完整的双轨评测(质量评测 21/21 vs 4/8、触发评测三轮迭代 F1 0.90 → 1.00、全样本 3/3 全票一致)拆给你看,附 8 张数据信息图。读完你会知道——评测 skill 不只是看分数,更是看分数停在 100% 之后还有什么可以改。

Perplexity 的 Agent Skills:一套与 Zen of Python 几乎完全反向的设计哲学

Perplexity 把 Agent Skills 当一等公民来设计、迭代、维护。本文从原文出发,提炼五条反直觉心智模型——Zen of Skills、四属性、三层上下文成本、Description 即路由、Gotchas Flywheel——并结合 U.S. Income Tax Skill 失败案例与 PR 监控 Skill 路由案例,给出可落地的五步构建法、四套 Eval Suite 与一份 7 条带走清单,图文并茂。

Claude Skills 创建指南:关键步骤、局限性与实战示例

从 SKILL.md、触发描述到测试矩阵,系统拆解 Claude Skills 的创建方法

基于 Anthropic 官方博客 How to create Skills for Claude: steps and examples 的中文技术解读。文章系统梳理 Claude Skills 的核心价值、创建步骤、SKILL.md 结构、description 触发机制、测试验证方法、局限性分析,并结合 PDF、DOCX、品牌规范和前端设计等示例总结可落地实践。

Agent Skills 工程化深度解析:用 skill-creator 测试、度量并持续改进技能

从 evals、benchmark 到触发治理,系统拆解 Agent Skills 的工程化迭代方法

基于 Anthropic 官方博客 Improving skill-creator: Test, measure, and refine Agent Skills 的深度技术解读。文章系统分析 Agent Skills 为什么需要像软件一样测试,如何区分 capability uplift skills 与 encoded preference skills,如何设计 evals、benchmark、多智能体盲评和触发描述优化,并结合 PDF 表单、NDA 审查和周报生成案例总结可落地的工程实践。