功能描述
用于配置Server内是否使用RoCE环路进行多卡间的通信。
需要与环境变量HCCL_INTRA_PCIE_ENABL配合使用。下面对HCCL_INTRA_PCIE_ENABLE和HCCL_INTRA_ROCE_ENABLE的配置组合进行说明。
- HCCL_INTRA_PCIE_ENABLE和HCCL_INTRA_ROCE_ENABLE不配置或均配置为0,Server内采用PCIe环路进行多卡间的通信。
- HCCL_INTRA_PCIE_ENABLE为1,HCCL_INTRA_ROCE_ENABLE为0,Server内采用PCIe环路进行多卡间的通信,此组合方式为默认配置。
- HCCL_INTRA_PCIE_ENABLE为0,HCCL_INTRA_ROCE_ENABLE为1,Server内采用RoCE环路进行多卡间的通信。
- 不支持HCCL_INTRA_PCIE_ENABLE和HCCL_INTRA_ROCE_ENABLE均配置为1。
- 环境变量仅支持Atlas 训练系列产品下的Atlas 300T Pro 训练卡。
配置示例
export HCCL_INTRA_ROCE_ENABLE=1