昇腾NPU硬件资源主要包括AICore(用于AI模型的计算)、AICPU和内存等,NPU算力切分功能主要原理是将上述硬件资源根据用户指定的算力规格划分出vNPU,每个vNPU对应若干AICore、AICPU和内存资源。如不切分,边缘场景下会被识别为整卡使用。有关算力切分详细信息,请参考《昇腾虚拟化实例(AVI)用户指南》中的“使用指导”章节。
AtlasEdge现仅支持Atlas 500 Pro 智能边缘服务器(型号:3000)形态下Atlas 300I Pro 推理卡A300I Pro 推理卡的算力切分,且只支持通过FusionDirector部署容器。