文档
注册

MindX DL

MindX DL(昇腾深度学习组件)是支持Atlas训练卡、推理卡的深度学习组件,提供昇腾 AI 处理器集群调度、性能测试和模型保护等基础功能,快速使能合作伙伴进行深度学习平台开发。

成长地图

由浅入深,带您玩转MindX DL

MindX DL简介

了解MindX DL的产品定位与特点,有助于您快速构建自己的深度学习平台。

产品介绍

ToolBox

实用工具包toolbox中集成了ascend-dmi、ascend-cert和日志收集工具,为Atlas产品提供各项功能,方便您进行AI作业。

使用指导

常用操作

故障诊断

昇腾训练场景下指导用户使用设备日志清洗和故障诊断功能高效定位训练任务失败与训练性能劣化的问题。

安装部署

使用指导

参考信息

AI模型保护

为用户提供基于模型保护组件构建的完整模型保护流程及第三方平台对接配置指导。指导用户完成模型保护组件的安装部署、信息配置、组网使用。

参考指导

API接口参考

虚拟化实例

昇腾虚拟化是指通过资源虚拟化的方式将物理机或虚拟机配置的NPU(昇腾AI处理器)切分成若干份vNPU(虚拟NPU)挂载到容器中使用,虚拟化管理方式能够实现统一不同规格资源的分配和回收处理,满足多用户反复申请/释放的资源操作请求。

方案介绍

应用场景

虚拟化规则

使用指导

集群调度

MindX DL集群调度基于业界流行的集群调度系统Kubernetes,提供昇腾AI处理器资源管理和查看;实现了昇腾AI处理器优化调度、生成分布式训练集合通信配置等基础功能。深度学习平台开发厂商可以借助集群调度组件有效减少底层资源调度相关软件开发工作量,快速使能合作伙伴基于MindX DL开发深度学习平台。

方案介绍

安装部署

快速体验

部署训练任务

部署推理任务

断点续训

故障处理

参考信息

Ascend Docker Runtime

Ascend Docker Runtime(又称Ascend Docker,又称昇腾容器运行时)是MindX DL的基础组件,用于为所有的训练或推理作业提供昇腾处理器(Ascend NPU)容器化支持,使用户AI作业能够以Docker容器的方式平滑运行在昇腾设备之上。

方案介绍

安装部署

使用指导

常用操作

参考信息

MindIO

MindIO加速大模型CheckPoint功能主要针对大模型训练中的CheckPoint的保存及加载进行加速,CheckPoint的数据先写入训练服务器的内存系统中,再异步写入后端的可靠性存储设备中。

方案介绍

安装部署

使用指导

常用操作

参考信息

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词