Atlas 训练系列产品的昇腾AI处理器是华为研发的一款高性能AI处理器。其内部的处理器之间采用HCCS(例如:A0~A3为一个HCCS)方式连接。每台设备具备两个HCCS环共8个昇腾AI处理器(A0~A7)。每个HCCS存在4个昇腾AI处理器,同一HCCS内AI处理器可做数据交换,不同HCCS内昇腾AI处理器不能通信。同一Pod分配的昇腾AI处理器(若小于或等于4)必须在同一个HCCS环内,否则任务运行失败。Atlas 训练系列产品互联拓扑如图1所示,其中K0~K3为鲲鹏处理器。
Atlas 800T A2 训练服务器和Atlas 900 A2 PoD 集群基础单元没有昇腾AI处理器的亲和性调度。