Atlas 200T A2 Box16 异构子框的资源申请约束
根据业务模型,对Atlas 200T A2 Box16 异构子框训练任务资源申请作如下要求:
- 训练任务申请的昇腾AI处理器数量不能大于节点昇腾AI处理器总数。
- 训练任务申请的昇腾AI处理器数量个数为1~8、10、12、14和16。
- 当训练任务申请的昇腾AI处理器数量不大于8个时,需要选取同一个HCCS互联内的昇腾AI处理器。
- 当训练任务为10、12、14时,需要将所需的昇腾AI处理器平均分配到两个环,相对的物理地址也一致。
- 当训练任务申请的昇腾AI处理器数量为16个时,需要将节点的昇腾AI处理器全部分配给该任务。
- 遵循Volcano开源部分的其他约束。