获取软件包
获取相应的软件可参见下载软件包;获取相应软件包的源码可参见获取开源组件源码进行操作。部分组件软件包请参考表1获取并通过软件sum值验证;部分组件软件包请参考表2获取并通过软件数字签名验证。
下载软件包
下载本软件即表示您同意华为企业业务最终用户许可协议(EULA)的条款和条件。

{version}表示软件版本号,{arch}表示CPU架构。
组件 |
包内文件列表 |
说明 |
获取链接 |
---|---|---|---|
Ascend-docker-runtime_{version}_linux-{arch}.run |
ascend-docker-cli |
MindCluster Ascend Docker Runtime运行所必需的可执行程序,不建议用户直接运行。 |
|
ascend-docker-destroy |
|||
ascend-docker-hook |
|||
ascend-docker-plugin-install-helper |
|||
ascend-docker-runtime |
|||
assets |
说明资料的图片资源。 |
||
base.list* |
默认的挂载列表,安装时,程序会根据install-type,安装不同的挂载列表。 |
||
run_main.sh |
安装脚本,不建议用户直接使用。 |
||
uninstall.sh |
卸载脚本,不建议用户直接使用。 |
||
README.md |
MindCluster Ascend Docker Runtime说明资料,包含设计原理。 |
||
Ascend-mindxdl-npu-exporter_{version}_linux-{arch}.zip |
npu-exporter |
MindCluster NPU Exporter二进制文件。 |
|
Dockerfile |
MindCluster NPU Exporter镜像构建文本文件。 |
||
Dockerfile-310P-1usoc |
Atlas 200I SoC A1 核心板上MindCluster NPU Exporter镜像构建文本文件。 |
||
run_for_310P_1usoc.sh |
Atlas 200I SoC A1 核心板上MindCluster NPU Exporter镜像中启动组件的脚本。 |
||
npu-exporter-v{version}.yaml |
MindCluster NPU Exporter的启动配置文件。 |
||
npu-exporter-310P-1usoc-v{version}.yaml |
Atlas 200I SoC A1 核心板上MindCluster NPU Exporter的启动配置文件。 |
||
Ascend-mindxdl-device-plugin_{version}_linux-{arch}.zip |
device-plugin |
MindCluster Ascend Device Plugin二进制文件。 |
|
Dockerfile |
MindCluster Ascend Device Plugin镜像构建文本文件。 |
||
Dockerfile-310P-1usoc |
Atlas 200I SoC A1 核心板上MindCluster Ascend Device Plugin镜像构建文本文件。 |
||
run_for_310P_1usoc.sh |
Atlas 200I SoC A1 核心板上MindCluster Ascend Device Plugin镜像中启动组件的脚本。 |
||
faultCode.json |
记录芯片故障码与其故障恢复方式的对应关系。 须知:
系统配置文件,请勿随意修改,否则可能会导致系统故障处理功能出错。 |
||
faultCustomization.json |
芯片故障频率及时长默认配置文件。 须知:
系统配置文件,请勿随意修改,否则可能会导致系统故障处理功能出错。 |
||
device-plugin-310-v{version}.yaml |
推理服务器(插Atlas 300I 推理卡)上不使用MindCluster Volcano的配置文件。 |
||
device-plugin-310-volcano-v{version}.yaml |
推理服务器(插Atlas 300I 推理卡)上使用MindCluster Volcano的配置文件。 |
||
device-plugin-310P-v{version}.yaml |
Atlas 推理系列产品设备上不使用MindCluster Volcano的配置文件。 |
||
device-plugin-310P-volcano-v{version}.yaml |
Atlas 推理系列产品设备上使用MindCluster Volcano的配置文件。 |
||
device-plugin-310P-1usoc-v{version}.yaml |
Atlas 200I SoC A1 核心板上不使用MindCluster Volcano的配置文件。 |
||
device-plugin-310P-1usoc-volcano-v{version}.yaml |
Atlas 200I SoC A1 核心板上使用MindCluster Volcano的配置文件。 |
||
device-plugin-910-v{version}.yaml |
Atlas 训练系列产品或Atlas A2 训练系列产品上不使用MindCluster Volcano的配置文件。 |
||
device-plugin-volcano-v{version}.yaml |
Atlas 训练系列产品或Atlas A2 训练系列产品上使用MindCluster Volcano的配置文件。 |
||
Ascend-mindxdl-volcano_{version}_linux-{arch}.zip |
volcano-npu_{version}_linux-{arch}.so |
MindCluster Volcano华为NPU调度插件动态链接库。 |
|
Dockerfile-scheduler |
Volcano scheduler镜像构建文本文件。 |
||
Dockerfile-controller |
Volcano controller镜像构建文本文件。 |
||
volcano-v{version}.yaml |
MindCluster Volcano的启动配置文件。 |
||
vc-scheduler |
volcano-scheduler组件二进制文件。 |
||
vc-controller-manager |
volcano-controller组件二进制文件。 |
||
说明: MindCluster Volcano组件根据版本的不同,支持的K8s的版本也不同。v1.4.0版本支持的K8s版本为1.16.x~1.21.x;v1.7.0版本支持的K8s版本为1.17.x~1.25.x。请根据K8s版本选择合适的MindCluster Volcano版本。 |
|||
Ascend-mindxdl-ascend-operator_{version}_linux-{arch}.zip |
ascend-operator |
MindCluster Ascend Operator二进制文件。 |
|
Dockerfile |
MindCluster Ascend Operator镜像构建文本文件。 |
||
ascend-operator-v{version}.yaml |
MindCluster Ascend Operator的启动配置文件(不需要用户导入KubeConfig文件)。 |
||
Ascend-mindxdl-hccl-controller_{version}_linux-{arch}.zip |
hccl-controller |
MindCluster HCCL Controller二进制文件。 |
|
Dockerfile |
MindCluster HCCL Controller镜像构建文本文件。 |
||
hccl-controller-v{version}.yaml |
MindCluster HCCL Controller的启动配置文件(不需要用户导入KubeConfig文件)。 |
||
Ascend-mindxdl-noded_{version}_linux-{arch}.zip |
noded |
MindCluster NodeD二进制文件。 |
|
noded-v{version}.yaml |
MindCluster NodeD的启动配置文件。 |
||
NodeDConfiguration.json |
记录节点硬件故障码与其故障恢复方式的对应关系。 |
||
Dockerfile |
MindCluster NodeD镜像构建文本文件。 |
软件SUM值验证
为了防止软件包在传递过程中或存储期间被恶意篡改,下载软件包时需下载对应的完整性校验文件用于完整性验证。校验方式参考如下,以Ascend-mindxdl-hccl-controller_6.0.RC2_linux-x86_64.zip和Ascend-mindxdl-hccl-controller_6.0.RC2_linux-x86_64.zip.sum为例,进行软件SUM值验证;SUM文件中的值请以实际情况为准。
- 将下载的软件包以及对应的完整性校验文件上传到Linux服务器,如“/home/ascend-hccl-controller”目录下。
- 进入“/home”目录,执行如下操作从sum文件中读取对应架构的软件包的SUM值。
cat /home/Ascend-mindxdl-hccl-controller_6.0.RC2_linux-x86_64.zip.sha256sum
回显示例如下。
1521a347b1aa30e0d31dbc86cd7803d7bae483e08422c3c96f9a00db011d10b8
- 将上一步读取的SUM值与对应架构的软件包的名字按照下面的示例构造命令,然后回车执行。
echo "1521a347b1aa30e0d31dbc86cd7803d7bae483e08422c3c96f9a00db011d10b8 Ascend-mindxdl-hccl-controller_6.0.RC2_linux-x86_64.zip" | sha256sum --check
回显示例如下则表示校验成功,软件包没有被篡改过,该软件包可以正常使用。
Ascend-mindxdl-hccl-controller_6.0.RC2_linux-x86_64.zip: OK
组件 |
包内文件列表 |
说明 |
获取链接 |
---|---|---|---|
Ascend-mindxdl-clusterd_{version}_linux-{arch}.zip |
clusterd |
MindCluster ClusterD二进制文件。 |
|
clusterd-v{version}.yaml |
MindCluster ClusterD的启动配置文件。 |
||
Dockerfile |
MindCluster ClusterD镜像构建文本文件。 |
||
Ascend-mindxdl-resilience-controller_{version}.zip |
resilience-controller |
MindCluster Resilience Controller二进制文件。 |
|
cert-importer |
证书导入工具二进制文件。 |
||
Dockerfile |
MindCluster Resilience Controller镜像构建文本文件。 |
||
resilience-controller-v{version}.yaml |
MindCluster Resilience Controller的启动配置文件(不需要用户导入KubeConfig文件)。 |
||
resilience-controller-without-token-v{version}.yaml |
MindCluster Resilience Controller的启动配置文件(需要用户导入KubeConfig文件)。 |
||
lib |
加密组件依赖的动态库文件。 |
||
Ascend-mindxdl-elastic_{version}.zip |
mindx_elastic-0.0.1-py3-none-linux_{arch}.whl |
断点续训特性二进制文件。 |

{version}表示软件版本号,{arch}表示CPU架构。
软件数字签名验证
为了防止软件包在传递过程中或存储期间被恶意篡改,下载软件包时需下载对应的数字签名文件用于完整性验证。
在软件包下载之后,请参考《OpenPGP签名验证指南》,对从Support网站下载的软件包进行PGP数字签名校验。如果校验失败,请不要使用该软件包,先联系华为技术支持工程师解决。
使用软件包安装/升级之前,也需要按上述过程先验证软件包的数字签名,确保软件包未被篡改。
运营商客户请访问:https://support.huawei.com/carrier/digitalSignatureAction
企业客户请访问:https://support.huawei.com/enterprise/zh/tool/pgp-verify-TL1000000054