Toggle navigation
爱折腾的工程师
All Posts
ai
微信小程序
ARCHIVE
NOTES
ABOUT
爱折腾的工程师
未来的你会感谢现在努力的自己
DeepSeek-V3.2 多机推理部署指南:vLLM-Ascend 与 TIONE 在线服务
面向昇腾 Atlas 800 A2/A3 的 DeepSeek-V3.2 多机推理部署规范:vLLM-Ascend 原生部署与 TIONE 在线服务部署
本文档基于 vLLM-Ascend DeepSeek-V3.2 官方教程与 TIONE 3.11 在线服务实践,规范化描述 DeepSeek-V3.2 在昇腾 Atlas 800 A2/A3 上的多机推理部署流程。内容覆盖硬件与版本基线、容器与网络配置、vLLM 原生多机命令、TIONE 在线服务数据源与启动脚本、Prefill-Decode 分离部署、功能与性能验证以及运维排障清单,适用于生产环境落地。
Posted by iceyao on Tuesday, April 28, 2026
Software Developer, Open Source Enthusiast
FEATURED TAGS
agent
ai
ai agent
ai infra
api
claude
claude code
devops
devtools
evaluation
go
gpu/npu
helm
html
k8s
k8s 存储
k8s 网络
k8s 调度
kubelet
linux/系统
llm
mcp
openstack
prompt engineering
rag
skills
subagent
vllm
上下文工程
云原生平台
云计算
产品/随笔
产品实践
国产化
多智能体
容器
工作流
开发工具
弹性伸缩
控制器
故障排查
监控
网关
网络
自动化
设计模式
评估
部署实践