昇腾社区首页
中文
注册

HcclAllGatherV

产品支持情况

产品

是否支持

Atlas A2 训练系列产品

Atlas 800I A2 推理产品

x

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品

Atlas 训练系列产品

x

Atlas 200/300/500 推理产品

x

针对Atlas 推理系列产品,仅支持此系列产品中的Atlas 300I Duo 推理卡

功能说明

集合通信算子AllGatherV的操作接口,将通信域内所有节点的输入按照rank id重新排序,然后拼接起来,再将结果发送到所有节点的输出。

与AllGather算子不同的是,AllGatherV算子支持通信域内不同节点的输入配置不同大小的数据量。

针对AllGatherV操作,每个节点都接收按照rank id重新排序后的数据集合,即每个节点的AllGatherV输出都是一样的。

函数原型

1
HcclResult HcclAllGatherV(void *sendBuf, uint64_t sendCount, void *recvBuf, const void *recvCounts, const void *recvDispls, HcclDataType dataType, HcclComm comm, aclrtStream stream)

参数说明

参数名

输入/输出

描述

sendBuf

输入

源数据buffer地址。

sendCount

输入

参与AllGatherV操作的sendBuf的数据size。

recvBuf

输出

目的数据buffer地址,集合通信结果输出至此buffer中。

recvCounts

输出

参与AllGatherV操作的每个rank在recvBuf中的数据size。

该数组的第i个元素表示需要从rank i接收的数据量,且该数据量需要与rank i的sendCount值相同。

recvDispls

输出

参与AllGatherV操作的每个rank的数据在recvBuf中的偏移量(单位为dataType)。该数组的第i个元素表示从rank i接收的数据应该放置在recvBuf中的起始偏移量。

dataType

输入

AllGatherV操作的数据类型,HcclDataType类型。

针对Atlas A2 训练系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。

针对Atlas 300I Duo 推理卡,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64。

comm

输入

集合通信操作所在的通信域。

stream

输入

本rank所使用的stream。

返回值

HcclResult:接口成功返回HCCL_SUCCESS,其他失败。

约束说明

  • 所有rank的recvCounts、recvDispls、dataType均应相同。
  • 针对Atlas A2 训练系列产品,仅支持单机场景,针对Atlas 200T A2 Box16 异构子框,仅支持使用单模组的场景,即只使用前8卡或者后8卡。
  • 针对Atlas 300I Duo 推理卡,最多支持单机两卡的场景。