下载
中文
注册

单机带宽低

问题现象

使用HCCL Test工具测试单机带宽时,单机带宽峰值低于预期值。

原因分析

  1. 日志等级设置不是error。

    若某些卡的日志等级设置不是error,可能会导致对应卡的带宽降低(某些场景下,可能会导致带宽降低2GB左右)。

  2. 某条链路带宽低。

    某条链路带宽低会导致单机整机单宽低。

解决步骤

  1. 若是日志级别设置不是error导致的带宽降低,可通过重新设置Host侧与Device侧日志级别为error解决。

    Host侧日志级别:

    export ASCEND_GLOBAL_LOG_LEVEL=3   // (0:debug 1:info 2:warning 3:error)

    Device侧日志操作:

    # 查询 
    for i in {0..7}; do /usr/local/Ascend/driver/tools/msnpureport -r -d $i; done
    # 设置
    for i in {0..7}; do msnpureport -g error -d $i; done
  2. 若重设日志级别后,带宽仍然较低,可分析是否某条链路HCCS带宽低,或者PCIe带宽低。
    可通过ascend-dmi命令测p2p的带宽,命令示例如下:
    • 测试卡0到卡8的链路带宽:

      ascend-dmi --bw -t p2p --ds 0 --dd 8

    • 测试全量p2p带宽:

      ascend-dmi --bw -t p2p

      全量p2p带宽测试时间较长,预计20分钟左右。

    获取以上数据后,单击Link联系技术支持。