设备运行过程中出现D2H/H2D带宽偏低告警
2024/02/21
223
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 安装部署 | 硬件(Atlas 800T A2 训练服务器) | D2H/H2D带宽偏低 |
问题描述
设备在正常运行中出现D2H/H2D带宽偏低告警,且情况分为以下两种。
解决方案
- D2H/H2D带宽偏低,且与阈值相差不大。
- 登录BIOS界面,具体请参见进入BIOS界面。
- 打开高性能模式(Advanced-Performance Config-Power Policy-Performance)和one numa使能仅作用于CentOS系统(Advanced-Memory Config-One Numa Per Socket-Enable),具体请参见《华为Atlas服务器 BIOS 参数参考 (鲲鹏920处理器)》。
- D2H/H2D带宽偏低,且与阈值相差较大。
主板到对应模组之间的连接线缆,拔出清理(清理请参见NPU模组不在位或PCIe建链失败或HCCS链路报错,需要重新插拔连接器或更换模组板的场景时,需使用清洁工具清洁UBC、MEZZ等高速连接器)后重新插拔,检查插拔无误后,再进行带宽检查,即可解决问题
本页内容