文档
注册

HcclGetCommAsyncError

功能说明

当集群信息中存在Device网口通信链路不稳定、出现网络拥塞的情况时,Device日志中会存在“error cqe”的打印,我们称这种错误为“RDMA ERROR CQE”错误。

当前版本,此接口仅支持查询通信域内是否存在“RDMA ERROR CQE”的错误。

此接口为同步接口,即接口调用后需要等待返回结果。

函数原型

HcclResult HcclGetCommAsyncError(HcclComm comm, HcclResult *asyncError)

参数说明

参数名

输入/输出

描述

comm

输入

通信域。

asyncError

输出

结果为0, 表示该通信域内无错误发生;其他返回值,请参见HcclResult类型。

返回值

参见HcclResult类型,当前版本仅返回HCCL_E_REMOTE错误类型。

约束说明

  • 建立通信域后,才可调用此接口。
  • 通信域销毁后,不可调用此接口。

支持的型号

Atlas 训练系列产品

Atlas 300I Duo 推理卡

Atlas A2 训练系列产品

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词