Toggle navigation
爱折腾的工程师
All Posts
ARCHIVE
NOTES
ABOUT
爱折腾的工程师
未来的你会感谢现在努力的自己
DeepSeek-V3.2 多机推理部署指南:vLLM-Ascend 与 TIONE 在线服务
面向昇腾 Atlas 800 A2/A3 的 DeepSeek-V3.2 多机推理部署规范:vLLM-Ascend 原生部署与 TIONE 在线服务部署
本文档基于 vLLM-Ascend DeepSeek-V3.2 官方教程与 TIONE 3.11 在线服务实践,规范化描述 DeepSeek-V3.2 在昇腾 Atlas 800 A2/A3 上的多机推理部署流程。内容覆盖硬件与版本基线、容器与网络配置、vLLM 原生多机命令、TIONE 在线服务数据源与启动脚本、Prefill-Decode 分离部署、功能与性能验证以及运维排障清单,适用于生产环境落地。
Posted by iceyao on Tuesday, April 28, 2026
Software Developer, Open Source Enthusiast
FEATURED TAGS
ai agent
ai infra
api
claude
claude code
devops
go
gpu/npu
helm
k8s
k8s 存储
k8s 网络
k8s 调度
kubelet
linux/系统
llm
mcp
openstack
prompt engineering
rag
skills
subagent
vllm
上下文工程
云原生平台
云计算
产品/随笔
产品实践
国产化
多智能体
容器
工作流
开发工具
弹性伸缩
控制器
故障排查
监控
网关
网络
自动化
设计模式
评估
部署实践