HcclCommInitClusterInfo
功能说明
基于ranktable初始化HCCL通信域。
ranktable文件是一个json格式的文件,配置了参与集合通信的NPU资源信息,关于ranktable文件的配置可参见ranktable文件配置资源信息。
函数原型
HcclResult HcclCommInitClusterInfo(const char *clusterInfo, uint32_t rank, HcclComm *comm)
参数说明
参数名 |
输入/输出 |
描述 |
---|---|---|
clusterInfo |
输入 |
rank table的文件路径(含文件名),作为字符串最大长度为4096字节,含结束符。 |
rank |
输入 |
本rank的rank id。 需要注意,此参数取值需要与ranktable中对应的“rank_id”字段取值一致。 |
comm |
输出 |
将初始化后的通信域以指针的信息回传给调用者。 HcclComm类型的定义可参见HcclComm。 |
返回值
HcclResult:接口成功返回HCCL_SUCCESS,其他失败。
约束说明
重复初始化会报错。
支持的型号
Atlas 训练系列产品
Atlas 300I Duo 推理卡
Atlas A2 训练系列产品
父主题: 通信域管理