HcclCommInitRootInfoConfig
函数原型
HcclResult HcclCommInitRootInfoConfig(uint32_t nRanks, const HcclRootInfo *rootInfo, uint32_t rank, const HcclCommConfig *config, HcclComm *comm)
功能说明
根据rootInfo初始化HCCL,创建具有特定配置的HCCL通信域。
参数说明
参数名 |
输入/输出 |
描述 |
---|---|---|
nRanks |
输入 |
集群中的rank数量。 |
rootInfo |
输入 |
root rank信息,主要包含root rank的ip、id等信息,由HcclGetRootInfo接口生成。 |
rank |
输入 |
本rank的rank id。 |
config |
输入 |
通信域配置项,目前的可配置项为buffer大小、确定性计算开关。 HcclCommConfig类型,定义详见7.10 HcclCommConfig。 |
comm |
输出 |
初始化后的通信域指针。 |
返回值
HcclResult:接口成功返回HCCL_SUCCESS,其他失败。
约束说明
- 所有rank的nranks、rootInfo、config均应相同。
- 传入的config必须先调用HcclCommConfigInit对其进行初始化。
- config中的配置参数需确保在合法值域内,详见HcclCommConfig定义。
- 使用该接口时,config中的配置优先级高于环境变量的配置。
- 该接口只能串行调用,不支持并发调用。
支持的型号
Atlas 训练系列产品
Atlas 300I Duo 推理卡
Atlas A2 训练系列产品
父主题: 通信域管理