排查方法:先筛选B列type为stage, 看stage间是否有问题,再筛选B列type为rank,看rank是否有问题,根据以下几点排查。
- 根据Computing的时间差异判断是否有慢卡,或者有负载不均衡的现象。
- 根据Free统计是否有host bound或者分布不均现象。
- 根据Communication(Not Overlapped and Exclude Receive)时间判断是否通信耗时占比过大。
- 根据Bubble时间的占比和理论计算公式判断bubble设置是否合理,是否stage间有不均衡现象。