下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

HCCL_MULTI_QP_THRESHOLD

功能描述

两个rank之间使用多QP通信的场景下(即HCCL_RDMA_QPS_PER_CONNECTION取值大于1),开发者可通过本环境变量设置每个QP分担数据量的最小阈值。

该环境变量需要配置为整数,取值范围:[1,8192],默认值:512, 单位:KB。

  • 如果“(rank间单次通信数据量 / HCCL_RDMA_QPS_PER_CONNECTION取值) < HCCL_MULTI_QP_THRESHOLD取值”,则HCCL执行时会自动减少QP个数,使得每个QP上分担的数据量大于等于HCCL_MULTI_QP_THRESHOLD的取值,例如:

    rank间单次通信数据量为1MB,HCCL_RDMA_QPS_PER_CONNECTION配置为4,HCCL_MULTI_QP_THRESHOLD配置为512,此时每个QP最少要求分担512KB的数据量,则HCCL执行时,会减少QP个数为2,仅使用2个QP进行rank间的数据传输。

  • 当rank间数据量小于HCCL_MULTI_QP_THRESHOLD时使用单QP传输。
  • 当每个QP分担的数据量大于512KB时,使用HCCL Test工具进行RDMA流量测试时(仅测试跨机流量,不使用HCCS链路),多QP场景的下发调度开销相对于单QP场景性能劣化小于3%。

配置示例

export HCCL_MULTI_QP_THRESHOLD=512

使用约束

该环境变量需要配合HCCL_RDMA_QPS_PER_CONNECTION使用。

支持的型号

Atlas A2 训练系列产品

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词