爱折腾的工程师

未来的你会感谢现在努力的自己

DeepSeek-V3.2 多机推理部署指南：vLLM-Ascend 与 TIONE 在线服务

面向昇腾 Atlas 800 A2/A3 的 DeepSeek-V3.2 多机推理部署规范：vLLM-Ascend 原生部署与 TIONE 在线服务部署

本文档基于 vLLM-Ascend DeepSeek-V3.2 官方教程与 TIONE 3.11 在线服务实践，规范化描述 DeepSeek-V3.2 在昇腾 Atlas 800 A2/A3 上的多机推理部署流程。内容覆盖硬件与版本基线、容器与网络配置、vLLM 原生多机命令、TIONE 在线服务数据源与启动脚本、Prefill-Decode 分离部署、功能与性能验证以及运维排障清单，适用于生产环境落地。

Posted by iceyao on Tuesday, April 28, 2026

CL4R1T4S 项目深度解析：AI 系统透明度与系统提示词工程

从 25 家 AI 厂商的系统提示词说开去：一场由社区驱动的 AI 透明度实验

深度解析 GitHub 项目 elder-plinius/CL4R1T4S：一个收录了 OpenAI、Anthropic、Google、xAI、Cursor、Windsurf、Devin、Perplexity 等 25 家主流 AI 产品系统提示词的开源仓库。本文不仅梳理项目背景、仓库结构、分层技术架构和提取方法论，还逐一拆解 Claude Opus 4.7、ChatGPT-5、Grok 4.1、Gemini 2.5 Pro、Cursor Composer、Cascade、Devin 2.0、Perplexity Deep Research 八款知名产品的真实系统提示词片段，帮助开发者看清商用 LLM 背后 Prompt Scaffold 的工程化实践与价值取向差异。

Posted by iceyao on Monday, April 27, 2026

Claude 提示词工程最佳实践深度解析：原则、技巧与 Opus 4.7 适配

从黄金法则到 effort 参数：一份面向开发者的 Claude 提示词工程实战指南

基于 Anthropic 官方 Claude Prompting Best Practices 文档的深度解读。系统性整理 Claude 的通用提示词原则、XML 结构化、长上下文排版、effort 参数调优、工具使用与代理工作流治理等关键技术，并重点解析 Claude Opus 4.7 在指令遵循、工具使用、子代理、前端默认风格等方面的行为变化，帮助开发者在真实产品中高效、稳定地驾驭 Claude。

Posted by iceyao on Saturday, April 25, 2026

Claude Code 会话管理与百万上下文窗口深度解析

从上下文窗口到会话管理，全面掌握 Claude Code 百万 Token 的正确使用方式

深入解析 Claude Code 百万 Token 上下文窗口的工作原理、上下文腐化机制，以及 /compact、/clear、/rewind、Subagent 等会话管理策略的最佳实践。通过架构图、代码示例和决策模型，帮助开发者最大化利用大上下文窗口的生产力。

Posted by iceyao on Thursday, April 16, 2026

Claude Code 子代理 (Subagents) 深度解析：架构、机制与最佳实践

独立上下文、并行执行、差异化权限——深入理解 Claude Code 子代理的架构设计与工程实践

深入解析 Claude Code 中子代理(Subagents)的技术原理、核心功能及实现机制。涵盖子代理的架构设计、五种触发方式（对话式调用、自定义代理、CLAUDE.md、技能、挂钩）、实用模式（研究、并行、审查、管道）以及最佳实践，帮助开发者高效利用子代理完成复杂编程任务。

Posted by iceyao on Thursday, April 16, 2026