HCCS链路报错或P2P带宽不满足要求
2024/02/21
407
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 安装部署 | 硬件(Atlas 800T A2 训练服务器) | HCCS链路 |
问题描述
HCCS链路报错或P2P带宽不满足要求。
解决方案
验证为持续问题后,拆机检查NPU模组与NPU载板连接器是否有异物(连接器位置请参见NPU模组与NPU载板的连线),如果无异物,检查模组螺丝是否拧紧,确认拧紧后,若问题仍然复现,则可更换NPU载板或NPU模组,具体更换操作请参见NPU模组或NPU载板。
正常P2P带宽,如图1所示。如果相对于其他链路偏小则表示有问题。图1为总表,应从横竖两排对应,例如NPU0至NPU1的链路带宽则是竖1横0交汇处。
本页内容