软件环境

集群容器化部署依赖Kubernetes和MindCluster,具体部署场景请参考表1,Kuberntetes组件详细介绍请参见Kubernetes安装工具MindCluster组件详细介绍请参见《MindCluster 集群调度组件及特性介绍》的“组件介绍”章节

表1 依赖列表

依赖包

软件说明

管理节点是否安装

计算节点是否安装

Kubernetes

kubectl

Kubernetes的命令行工具。

Y

N

kubeadm

创建和管理Kubernetes集群工具。

Y

Y

kubelet

在集群中的每个节点上用来启动容器。

Y

Y

MindCluster

Ascend Device Plugin

基于Kubernetes设备插件机制,提供昇腾AI处理器的设备发现、分配和健康状态上报功能,使能Kubernetes管理昇腾AI处理器资源。需安装Ascend Docker Runtime后方可使用。

N

Y

Ascend Operator

创建ranktable文件,并按照configmap映射的方式挂载到容器,可以实现多个节点NPU设备之间的数据通信和任务协调,优化集合通信建链性能。

Y

Y

Volcano

基于开源Volcano调度插件机制,增加昇腾AI处理器的亲和性调度、故障重调度等特性,最大化发挥昇腾AI处理器计算性能。

Y

Y

Ascend Docker Runtime

提供docker或containerd的昇腾容器化支持,自动挂载所需文件和设备依赖。

N

Y