环境依赖
为保证安装成功,软硬件环境需要满足一定的要求。
硬件环境
类型 |
配置参考 |
---|---|
服务器(单机场景) |
|
服务器(集群场景) |
管理节点支持多种类型服务器,如Taishan 200服务器(型号2280)、FusionServer Pro 2288H V5等 |
计算节点:
|
|
存储节点:存储服务器 |
|
内存 |
管理节点内存>64GB |
磁盘空间 |
>1TB 磁盘空间规划请参见表3。 |
网络 |
|
软件环境
安装前,需要完成以下环境的安装,如表2所示。
ARM架构和X86架构对应的依赖不一样,请根据系统架构选择。
软件名称 |
版本 |
安装位置 |
获取方式 |
---|---|---|---|
Kubernetes |
1.16.x~1.19.x |
所有节点 |
Kubernetes社区,建议选择最新的bugfix版本。 |
Docker |
18.09.x |
所有节点 |
Docker社区,Docker的配套版本请参见Kubernetes要求,建议选择最新的bugfix版本。 |
操作系统 |
|
所有节点 |
- |
昇腾AI处理器驱动和固件 |
计算节点 |
||
(可选)CANN |
只安装MindX DL的情况下可不安装CANN,用户可根据实际需要选择安装所需的CANN软件包,可参见版本配套表安装对应的软件包。
|
计算节点或者训练推理容器内 |
- |
- 已完成Docker的安装(安装Docker)。
- 已完成Ascend Docker Runtime安装,请参见《MindX ToolBox用户指南》安装实用工具包“Ascend-mindx-toolbox_{version}_linux-{arch}.run”。
Ascend Device Plugin若部署在Atlas 200I Soc A1 核心板上,无需安装Ascend Docker Runtime。
- 已完成K8s集群搭建(安装Kubernetes),且至少已解除管理节点隔离。
- 解除单节点隔离。
kubectl taint nodes <hostname> node-role.kubernetes.io/master-
- 解除所有节点隔离。
kubectl taint nodes --all node-role.kubernetes.io/master-
- 解除单节点隔离。
操作系统磁盘分区
操作系统磁盘分区推荐如表3所示。
分区 |
说明 |
大小 |
bootable flag |
---|---|---|---|
/boot |
启动分区 |
500 MB |
on |
/var |
软件运行所产生的数据存放分区,如日志、缓存等 |
> 300 GB |
off |
/var/lib/docker |
Docker镜像与容器存放分区
说明:
Docker镜像和容器默认放在“/var/lib/docker”分区下,如果“/var/lib/docker”分区使用率大于85%,K8s会启动自动删除镜像机制,使用时请确保“/var/lib/docker”分区使用率在85%以下。 |
> 300 GB |
off |
/data |
数据分区 |
> 400 GB |
off |
/ |
主分区 |
> 100 GB |
off |