MindCluster组件安装

MindIE MS依赖MindCluster中的Ascend Docker RuntimeAscend Device PluginVolcanoAscend Operator组件。其中VolcanoAscend Operator组件在管理节点安装,其他组件在计算节点上安装。

  1. 请参考《MindCluster 集群调度安装指南》的“安装部署 > 手动安装 > 安装前准备”章节完成创建节点标签、创建用户、创建日志目录和创建命名空间。
  2. 请参考《MindCluster 集群调度安装指南》的“ 安装部署 > 手动安装 > Ascend Docker Runtime”章节中的“Containerd场景下安装Ascend Docker Runtime”安装Ascend Docker Runtime
  3. 请参考《MindCluster 集群调度安装指南》的“安装部署 > 手动安装 > Ascend Device Plugin”章节安装Ascend Device Plugin,使用device-plugin-xxx-v{version}.yaml文件进行安装。

    Ascend Device Plugin启动时,xxx.yaml配置文件中useAscendDocker参数配置为true且用户已安装Ascend Docker Runtime并生效,会自动挂载在“/usr/local/Ascend”下驱动相关目录。

  4. 请参考《MindCluster 集群调度安装指南》的“ 安装部署 > 手动安装 > Volcano”章节安装Volcano

    • 请使用v1.7.0版本的volcano进行安装。
    • 在单机场景下,参考《MindCluster 集群调度安装指南》的“ 安装部署 > 手动安装 > Volcano”章节安装Volcano时,在执行“Volcano”章节中的步骤9前,需要修改Volcano解压后生成的volcano-v1.7.0目录下的volcano-v1.7.0.yaml文件,搜索“useClusterInfoManager”字段并将该值改为“false”,如下图所示,修改完成后,再执行“Volcano”章节中的步骤9。

  5. 请参考《MindCluster 集群调度安装指南》的“安装部署 > 手动安装 > Ascend Operator”章节安装Ascend Operator