Toggle navigation
爱折腾的工程师
All Posts
ARCHIVE
NOTES
ABOUT
爱折腾的工程师
未来的你会感谢现在努力的自己
vLLM-Ascend 多机推理HCCL通信原理深度解析
从 vLLM-Ascend DeepSeek-V3.2 多机部署出发,深入解析 HCCL 初始化、通信组构建与跨节点张量传输机制
基于 vLLM-Ascend DeepSeek-V3.2 多机推理教程,系统分析 HCCL 在 Ascend 多机多卡推理中的初始化流程、Rank 与通信组建模、TP/DP/EP 并行下的通信拓扑,以及跨节点张量传输的底层数据流。文章包含多张架构图和流程图,帮助理解 vLLM-Ascend 如何通过 HCCL、Gloo、DP RPC 与 NPU 网络协同支撑大模型多机推理。
Posted by iceyao on Wednesday, April 29, 2026
Software Developer, Open Source Enthusiast
FEATURED TAGS
agent
ai
ascend
claude
claude code
devops
go
k8s
kubernetes
llm
multi-agent
openstack
python
rag
tkestack
vllm
练车