规格约束
HCCL性能测试工具会按照用户配置的单个计算节点参与训练的NPU个数来拉起Device,假设单个计算节点上参与训练的NPU个数为x(即-p后的参数取值为x),则会从Device ID为0的设备开始,连续拉起x个Device。
针对Atlas 训练系列产品:
- 若“-p”配置为1,拉起的Device ID为:0
- 若“-p”配置为2,拉起的Device ID为:0,1
- 若“-p”配置为4,拉起的Device ID为:0,1,2,3
- 若“-p”配置为8,拉起的Device ID为:0,1,2,3,4,5,6,7
针对Atlas A2 训练系列产品:
- 若“-p”配置为1,拉起的Device ID为:0
- 若“-p”配置为2,拉起的Device ID为:0,1
- 若“-p”配置为3,拉起的Device ID为:0,1,2
- 若“-p”配置为4,拉起的Device ID为:0,1,2,3
- 若“-p”配置为5,拉起的Device ID为:0,1,2,3,4
- 若“-p”配置为6,拉起的Device ID为:0,1,2,3,4,5
- 若“-p”配置为7,拉起的Device ID为:0,1,2,3,4,5,6
- 若“-p”配置为8,拉起的Device ID为:0,1,2,3,4,5,6,7
父主题: HCCL性能测试工具