文档
注册

HcclBatchSendRecv

功能说明

集合通信域异步批量点对点通信操作接口。调用一次接口可以完成本rank上的多个收发任务,本rank发送和接收之间是异步的,发送和接收任务之间不会相互阻塞。

函数原型

HcclResult HcclBatchSendRecv(HcclSendRecvItem* sendRecvInfo, uint32_t itemNum, HcclComm comm, aclrtStream stream);

参数说明

参数名

输入/输出

描述

sendRecvInfo

输入

本rank需要下发的收发任务列表的首地址。

HcclSendRecvItem类型,详细可参见HcclSendRecvItem

itemNum

输入

本rank需要接收和发送的任务个数。

comm

输入

集合通信操作所在的通信域。

stream

输入

本rank所使用的stream。

返回值

HcclResult:接口成功返回HCCL_SUCCESS,其他失败。

约束说明

  • “异步”是指同一张卡上的接收和发送任务是异步的,不会相互阻塞。但是在卡间,收发任务依旧是同步的,因此,卡间的收发任务也同HcclSend、HcclRecv一样,必须是一一对应的。
  • 任务列表中不能有重复的send/recv任务,重复指向(从)同一rank发送(接收)的两个任务。
  • 当前版本此接口不支持Virtual Pipeline(VPP)开启的场景。
  • 针对Atlas 200T A2 Box16 异构子框,若Server内卡间出现建链失败的情况(错误码:EI0010),需要将环境变量HCCL_INTRA_ROCE_ENABLE配置为1,HCCL_INTRA_PCIE_ENABLE配置为0,让Server内采用RoCE环路进行多卡间的通信(请确保Server上存在RoCE网卡,且具有send/recv收发关系的设备之间RDMA链路互通),环境变量配置示例如下:
    export HCCL_INTRA_ROCE_ENABLE=1
    export HCCL_INTRA_PCIE_ENABLE=0

支持的型号

Atlas 训练系列产品

Atlas A2 训练系列产品

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词