(beta)torch.distributed.ProcessGroupHCCL
接口原型
torch.distributed.ProcessGroupHCCL(store, rank, size, timeout); -> ProcessGroup
功能描述
创建一个ProcessGroupHCCL对象并返回。
参数说明
- Store:torch.distributed.distributed_c10d.PrefixStore对象,可以通过构造函数构造。
- Rank:当前节点的rank序号。
- Size:全部通讯节点的数量。
- Timeout:通讯中断时间,判断节点断联,默认值为1800s。
支持的型号
- Atlas 训练系列产品
- Atlas A2 训练系列产品
- Atlas 推理系列产品
父主题: Distributed