下载
中文
注册

beta)torch.distributed.ProcessGroupHCCL

接口原型

torch.distributed.ProcessGroupHCCL(store, rank, size, timeout); -> ProcessGroup

功能描述

创建一个ProcessGroupHCCL对象并返回。

参数说明

  • Store:torch.distributed.distributed_c10d.PrefixStore对象,可以通过构造函数构造。
  • Rank:当前节点的rank序号。
  • Size:全部通讯节点的数量。
  • Timeout:通讯中断时间,判断节点断联,默认值为1800s。

支持的型号

  • Atlas 训练系列产品
  • Atlas A2 训练系列产品
  • Atlas 推理系列产品