HCCL on 爱折腾的工程师

HCCL on 爱折腾的工程师 https://www.iceyao.com.cn/tags/hccl/ Recent content in HCCL on 爱折腾的工程师 Hugo en-us Wed, 29 Apr 2026 00:00:00 +0000 vLLM-Ascend 多机推理HCCL通信原理深度解析 https://www.iceyao.com.cn/2026/04/29/vllm-ascend-hccl-multinode-inference/ Wed, 29 Apr 2026 00:00:00 +0000 https://www.iceyao.com.cn/2026/04/29/vllm-ascend-hccl-multinode-inference/ 一、引言：多机推理真正难的不是“启动多个进程” 参考文档：DeepSeek-V3.2 — vllm-ascend vLLM-Ascend 的 DeepSeek-V3.2 教程给出了 Atlas 800 A3/A2 上部署 W8A8 量化模型的多种方式：单机