界面介绍
功能说明
内存(Memory)界面提供了采集过程中内存信息的可视化呈现。用户可以通过内存折线图对整体内存趋势一目了然,也可以框选放大折线图中峰值区域并结合算子内存信息精准定位到内存消耗大的算子。
界面展示(动态图场景)
内存(Memory)界面由参数配置栏(区域一)、算子内存折线图(区域二)、内存申请/释放详情表(区域三)三个部分组成,如图1所示。
- 区域一:参数配置栏。
- 机器名称:仅当导入的DB文件中存在名称为“HOST_INFO”的表时,存在该选项。
- 卡序号(Rank ID):通过切换选项来查看不同卡的内存信息,切换之后整体界面即时刷新。
- 分组方式(Group By):通过切换不同的维度来展示内存信息,分为“全局”和“流”两个维度。
- 区域二:算子内存折线图。
- 算子分配(Operator Allocated)曲线表示算子在申请或释放内存时采集到的已分配内存的变化趋势,代表所有算子总的分配内存,此处采集到的内存数据由PyTorch和GE(Graph Engine,图引擎)申请。
- 算子保留(Operator Reserved)曲线表示算子在申请或释放内存时采集到的保留内存的变化趋势,代表所有算子总的保留内存,此处采集到的内存数据由PyTorch和GE申请。
- 算子持有(Operator Activated)曲线表示所持有的总内存,包括被其他流复用未释放的内存,此处采集到的内存数据由PyTorch中的流申请。如果没有“流”的信息,则没有算子持有曲线。
- 进程保留(APP Reserved)曲线表示整个进程保留的内存趋势。
- 区域三:内存申请/释放详情表,详细展示了每个算子的内存信息,表格支持排序、分页和跳转功能。单击每列的表头,可根据当前列的升序、降序和默认排序呈现数据。
界面展示(静态图场景)
内存(Memory)界面由参数配置栏(区域一)、算子内存折线图(区域二)、内存申请/释放详情表(区域三)三个部分组成,如图2所示。
- 区域一:参数配置栏,通过切换“卡序号”的选项来查看不同卡的内存信息,切换之后整体界面即时刷新。
- 区域二:算子内存折线图,由动态折线图和静态折线图组成,但静态折线图仅在MindSpore数据场景下存在。
- 动态折线图:
- 算子分配(Operator Allocated)曲线表示算子在申请或释放内存时采集到的已分配内存的变化趋势,代表所有算子总的分配内存,此处采集到的内存数据由PyTorch和GE(Graph Engine,图引擎)申请。
- 算子保留(Operator Reserved)曲线表示算子在申请或释放内存时采集到的保留内存的变化趋势,代表所有算子总的保留内存,此处采集到的内存数据由PyTorch和GE申请。
- 算子持有(Operator Activated)曲线表示所持有的总内存,包括被其他流复用未释放的内存,此处采集到的内存数据由PyTorch中的流申请。如果没有“流”的信息,则没有算子持有曲线。
- 进程保留(APP Reserved)曲线表示整个进程保留的内存趋势。
- 静态折线图:
仅在MindSpore数据场景下存在。通过切换图序号(Graph ID)查看所选卡的内存分配情况。
- 大小(Size):按节点索引(Index)动态申请的内存大小。
- 总大小(Total Size):自动预设的内存最大值。
- 动态折线图:
- 区域三:内存申请/释放详情表,详细展示了静态图中每个算子的内存信息,表格支持排序、分页和跳转功能。单击每列的表头,可根据当前列的升序、降序和默认排序呈现数据。
父主题: 内存(Memory)