爱折腾的工程师

未来的你会感谢现在努力的自己

把『基于 URL 写一篇博文』这条 prompt 救回来:一个 Claude Skill 的设计、打造与三轮评测实录

为什么「基于这个 URL 写一篇博文」这条 prompt 几乎注定塌?prompt-optimizer skill 用 5 维度心智模型 + 5 步工作流把它救回来。本文先讲清楚它从概念构思到定型上线的 4 阶段开发过程、设计动机和实现原理,再把一份完整的双轨评测(质量评测 21/21 vs 4/8、触发评测三轮迭代 F1 0.90 → 1.00、全样本 3/3 全票一致)拆给你看,附 8 张数据信息图。读完你会知道——评测 skill 不只是看分数,更是看分数停在 100% 之后还有什么可以改。

Perplexity 的 Agent Skills:一套与 Zen of Python 几乎完全反向的设计哲学

Perplexity 把 Agent Skills 当一等公民来设计、迭代、维护。本文从原文出发,提炼五条反直觉心智模型——Zen of Skills、四属性、三层上下文成本、Description 即路由、Gotchas Flywheel——并结合 U.S. Income Tax Skill 失败案例与 PR 监控 Skill 路由案例,给出可落地的五步构建法、四套 Eval Suite 与一份 7 条带走清单,图文并茂。

Claude Skills 创建指南:关键步骤、局限性与实战示例

从 SKILL.md、触发描述到测试矩阵,系统拆解 Claude Skills 的创建方法

基于 Anthropic 官方博客 How to create Skills for Claude: steps and examples 的中文技术解读。文章系统梳理 Claude Skills 的核心价值、创建步骤、SKILL.md 结构、description 触发机制、测试验证方法、局限性分析,并结合 PDF、DOCX、品牌规范和前端设计等示例总结可落地实践。

Agent Skills 工程化深度解析:用 skill-creator 测试、度量并持续改进技能

从 evals、benchmark 到触发治理,系统拆解 Agent Skills 的工程化迭代方法

基于 Anthropic 官方博客 Improving skill-creator: Test, measure, and refine Agent Skills 的深度技术解读。文章系统分析 Agent Skills 为什么需要像软件一样测试,如何区分 capability uplift skills 与 encoded preference skills,如何设计 evals、benchmark、多智能体盲评和触发描述优化,并结合 PDF 表单、NDA 审查和周报生成案例总结可落地的工程实践。

Claude Code Skill Runtime 深度解析:可复用 AI 工作流引擎的架构与实现

从 Promise Memoization、realpath 去重到 contextModifier 闭包链的 Skill Runtime 实现原理全解剖

一、引言:Skill 是 Claude Code 最精巧的运行时子系统 在 上一篇文章 中,我们全景式地拆解了 Claude Code 的启动流程、Agentic Loop、工具系统与权限治理。