send
功能说明
提供group内点对点通信发送数据的send功能。
函数原型
def send(tensor, sr_tag, dest_rank, group = "hccl_world_group")
参数说明
参数名 |
输入/输出 |
描述 |
---|---|---|
tensor |
输入 |
TensorFlow的tensor类型。 针对Atlas 训练系列产品,tensor支持的数据类型为:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64。 针对Atlas 300I Duo 推理卡,支持数据类型为:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64。 针对Atlas A2 训练系列产品,tensor支持的数据类型为:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。 |
sr_tag |
输入 |
int类型。 消息标签,相同sr_tag的send/recv对可以收发数据。 |
dest_rank |
输入 |
int类型。 数据的目标节点,该rank是group中的rank id。 |
group |
输入 |
String类型,最大长度为128字节,含结束符。 group名称,可以为用户自定义group或者"hccl_world_group"。 |
返回值
无。
约束说明
- 调用该接口的rank必须在当前接口入参group定义的范围内,不在此范围内的rank调用该接口会失败。
- 如果点对点收发数据的rank属于不同的AI Server,要保证昇腾AI处理器的物理id相同
- 要求send和receive必须配对使用,且和图中其他算子要有依赖关系。
支持的型号
Atlas 训练系列产品
Atlas 300I Duo 推理卡
Atlas A2 训练系列产品
调用示例
1 2 3 4 |
from npu_bridge.npu_init import * sr_tag = 0 dest_rank = 1 hccl_ops.send(tensor, sr_tag, dest_rank) |