集群容器化部署依赖Kubernetes和MindCluster,具体部署场景请参考表1,Kuberntetes组件详细介绍请参见Kubernetes安装工具;MindCluster组件详细介绍请参见《MindCluster 集群调度组件及特性介绍》的“组件介绍”章节。
依赖包 |
软件说明 |
管理节点是否安装 |
计算节点是否安装 |
---|---|---|---|
Kubernetes |
|||
kubectl |
Kubernetes的命令行工具。 |
Y |
N |
kubeadm |
创建和管理Kubernetes集群工具。 |
Y |
Y |
kubelet |
在集群中的每个节点上用来启动容器。 |
Y |
Y |
MindCluster |
|||
Ascend Device Plugin |
基于Kubernetes设备插件机制,提供昇腾AI处理器的设备发现、分配和健康状态上报功能,使能Kubernetes管理昇腾AI处理器资源。需安装Ascend Docker Runtime后方可使用。 |
N |
Y |
Ascend Operator |
创建ranktable文件,并按照configmap映射的方式挂载到容器,可以实现多个节点NPU设备之间的数据通信和任务协调,优化集合通信建链性能。 |
Y |
Y |
Volcano |
基于开源Volcano调度插件机制,增加昇腾AI处理器的亲和性调度、故障重调度等特性,最大化发挥昇腾AI处理器计算性能。 |
Y |
Y |
Ascend Docker Runtime |
提供docker或containerd的昇腾容器化支持,自动挂载所需文件和设备依赖。 |
N |
Y |