下载
中文
注册

dump数据文件Format转换

执行dump数据文件Format转换

本版本提供dump数据文件Format转换能力,用于用户根据自身需求将昇腾AI处理器生成的dump数据文件转换成numpy数据文件,方便查看。

该功能通过msaccucmp.py脚本实现,脚本存放在${INSTALL_DIR}/tools/operator_cmp/compare,${INSTALL_DIR}请替换为CANN软件安装后文件存储路径。若安装的Ascend-cann-toolkit软件包,以root安装举例,则安装后文件存储路径为:/usr/local/Ascend/ascend-toolkit/latest。

命令格式如下:

python3 msaccucmp.py convert -d dump_file [-out output] [-f format] [-s shape] [-o output_tensor] [-i input_tensor] [-c custom_script_path] [-v version] [-t type]

命令格式参数项说明如表1所示。

表1 Format转换参数项说明

参数名

描述

是否必选

-d

--dump_file

昇腾AI处理器生成的dump文件。

支持指定单个文件;单个路径(不支持递归嵌套,只支持文件的父目录);同时指定多个文件,文件名用逗号隔开,例如-d /{PATH}/dump_file1,/{PATH}/dump_file2。

-out

--output

转换后的数据存放目录,默认为当前路径。

不建议配置与当前用户不一致的其它用户目录,避免提权风险。

-f

--format

  • 命令行包含-f参数,表示进行format转换,指定转换后数据format。如果dump文件包含original_shape字段,则会根据original_shape对数据进行切片。支持的Format转换类型参见支持的Format转换类型
  • 命令行不包含-f参数,表示进行dump文件解析。

-s

--shape

format转换需要的shape,当前仅FRACTAL_NZ转换需要配置该参数,格式为([0-9]+,)+[0-9]+,每个数字必须大于0。配置-f时有效。

-o

--output_tensor

转换指定index的output数据,与-i互斥。配置-f时有效。

当-o与-i均未配置时,默认转换所有的input与output。

-i

--input_tensor

转换指定index的input数据,与-o互斥。配置-f时有效。

-c

--custom_script_path

用户自定义Format转换.py文件存放路径,需指定到“format_convert”目录的上一层目录。.py文件相关要求参见准备自定义Format转换.py文件。配置-f时有效。

不建议调用与当前用户不一致的其它用户目录下的自定义脚本文件,避免提权风险。

-v

--version

dump文件类型,1代表protobuf序列化后的数据文件,2代表自定义格式的数据文件。默认值为2。

-t

--type

输出文件的类型。取值为:

  • npy:输出文件保存为numpy格式。
  • msnpy:输出文件保存为numpy格式,一般用于MindSpore场景。
  • bin:输出文件保存为binary格式。

默认值为npy。

支持的Format转换类型

结果保存为“原始文件名.output.{index}.{shape}.npy”“原始文件名.input.{index}.{shape}.npy”,shape的格式如:1x3x224x224。

当前内置的Format转换支持如下类型:

  • FRACTAL_NZ转换NCHW
  • FRACTAL_NZ转换成NHWC
  • FRACTAL_NZ转换ND
  • HWCN转换FRACTAL_Z
  • HWCN转换成NCHW
  • HWCN转换成NHWC
  • NC1HWC0转换成HWCN
  • NC1HWC0转换成NCHW
  • NC1HWC0转换成NHWC
  • NCHW转换成FRACTAL_Z
  • NCHW转换成NHWC
  • NHWC转换成FRACTAL_Z
  • NHWC转换成HWCN
  • NHWC转换成NCHW
  • NDC1HWC0转换成NCDHW

一般情况下,非四维的Format是由四维Format转换而来,那么对于同一个非四维Format支持转换成多种Format类型的情况,该非四维Format只有重新转回原始的四维Format才有效。例如NC1HWC0支持转换成HWCN、NCHW、NHWC,但是被转换的NC1HWC0数据只有一种四维的原始数据,假设为HWCN,那么该NC1HWC0数据只能转换成HWCN。识别原始数据的Format类型需要了解ATC工具使用指南中的“高级功能 > 单算子模型转换”。

准备自定义Format转换.py文件

用户自定义的Format转换.py文件只能用来进行Format转换,文件安全性由用户自行保证。

为满足用户自定义Format转换,需要按以下要求准备:

  • .py文件命名需满足规则:“convert_{format_from}_to_{format_to}.py”,其中,format_from和format_to支持的类型如下:
    • NCHW
    • NHWC
    • ND
    • NC1HWC0
    • FRACTAL_Z
    • NC1C0HWPAD
    • NHWC1C0
    • FSR_NCHW
    • FRACTAL_DECONV
    • C1HWNC0
    • FRACTAL_DECONV_TRANSPOSE
    • FRACTAL_DECONV_SP_STRIDE_TRANS
    • NC1HWC0_C04
    • FRACTAL_Z_C04
    • CHWN
    • DECONV_SP_STRIDE8_TRANS
    • NC1KHKWHWC0
    • BN_WEIGHT
    • FILTER_HWCK
    • HWCN
    • LOOKUP_LOOKUPS
    • LOOKUP_KEYS
    • LOOKUP_VALUE
    • LOOKUP_OUTPUT
    • LOOKUP_HITS
    • MD
    • NDHWC
    • C1HWNCoC0
    • FRACTAL_NZ
    • NCHDW
  • .py文件内容需满足以下规则:
    1
    2
    3
    def convert(shape_from, shape_to, array):
        
        return numpy_array
    
    表2 参数说明

    参数

    说明

    shape_from

    array数据的转换前的shape,一维数组。

    shape_to

    array数据的转换后的shape,一维数组,可选。

    array

    一维原始数据。

    return

    返回值,返回转换后的numpy数组。

  • .py文件存放目录需满足:

    .py文件必须存放在“format_convert”目录下,如果该目录不存在,需要新建。