命令格式说明
通用参数
精度比对命令行格式如下:
python3 msaccucmp.py compare -m my_dump_path -g golden_dump_path [-f fusion_rule_file] [-cf close_fusion_rule_file] [-q quant_fusion_rule_file] [-out output] [-map] [-c custom_script_path] [-alg algorithm] [-v version] [-r range] [-overflow_detection] [-max]
命令行参数说明如表1所示。
精度比对工具保存在$HOME/Ascend/ascend-toolkit/latest/tools/operator_cmp/compare目录下。
参数名 |
参数说明 |
是否必选 |
---|---|---|
-m --my_dump_path |
基于昇腾AI处理器运行生成的数据文件所在目录。 由于dump数据文件是多个二进制文件,故须指定dump数据文件所在的父目录。如:$HOME/MyApp_mind/resnet50,其中resnet50文件夹下直接保存dump数据文件。 训练场景下:
|
是 |
-g --golden_dump_path |
基于GPU/CPU运行生成的原始网络数据文件所在目录。 由于npy数据文件是多个npy文件,故须指定npy数据文件所在的父目录。如:$HOME/Standard_caffe/resnet50 ,其中resnet50文件夹下直接保存npy数据文件。 当指定-cf参数时,该参数指定的就是模型转换关闭算子融合下dump数据文件的目录。 |
是 |
-f --fusion_rule_file |
全网层信息文件。 推理场景下:
训练场景下:
|
否 |
-cf --close_fusion_rule_file |
全网层信息文件(通过使用ATC转换.om模型文件生成的json文件,文件包含关闭算子融合功能情况下整网算子的映射关系)。 本参数详细使用指导请参见比对操作和分析。 仅推理场景支持本参数。 |
否 |
-q --quant_fusion_rule_file |
量化信息文件(昇腾模型压缩输出的json文件)。 通过AMCT量化生成的量化信息文件(*.json),文件包含整网量化算子映射关系,用于精度比对时算子匹配。 Caffe非量化原始模型 vs 量化离线模型场景时,与-f参数二选一;Caffe非量化原始模型 vs 量化原始模型场景时,仅使用本参数。 仅推理场景支持本参数。 |
否 |
-out --output |
比对数据结果存放路径,默认为当前路径。 训练场景下:
|
否 |
-map --mapping |
输出GPU/NPU的映射表。 一般情况下GPU/NPU的映射表需要在完成精度比对之后,才能从csv中获取。本参数实现在精度比对前,直接提取GPU/NPU的映射表。建议在比对数据量太大,需要提前获取GPU/NPU的映射表的场景下使用。详细操作请参见GPU/NPU映射表获取。 |
否 |
-c --custom_script_path |
用户自定义脚本文件存放路径,包括自定义算法.py文件和自定义Format转换.py文件,需指定到脚本目录的上一层目录。指定本参数时判断是否存在以下文件目录:
不建议调用与当前用户不一致的其它用户目录下的自定义脚本文件,避免提权风险。 |
否 |
-alg --algorithm |
比对算法维度,取值为:
可多选,配置格式为各取值间用逗号分隔,可配置为数字或算法名,例如0,1,2,RelativeError。 若只选择比对部分维度,则比对结果同样只展示对应维度。 |
否 |
-a --algorithm_options |
比对算法的高级选项,可为指定的算法设置参数,指定的算法必须是-alg参数的内置算法或者-c参数的自定义算法,被本参数设置后的算法以本参数设置的值执行运算。 输入格式为:算法名:参数名=值,参数名=值;算法名:参数名=值,参数名=值。参数之间是逗号分隔,不同算法是分号分隔,例如:"CosineSimilarity:max=1,min=0;aa:max=1,min=0"。其中算法名与-c参数自定义算法.py文件的algorithm_name(参见自定义算法.py文件准备)一致。 |
否 |
-v --version |
dump文件类型,1代表protobuf序列化后的数据文件,2代表自定义格式的数据文件。默认取2。 |
否 |
-r --range |
设定算子比对范围。配置方式如下:
配置格式为:“start,end,step”。比如:-r 1,101,20,表示算子1,21,41,61,81,101的Tensor参与比对。 不配置本参数时,比对网络模型中的所有参与计算的算子。 Caffe非量化原始模型 vs 量化原始模型和Ascend vs Ascend精度比对场景不支持配置本参数。 须先配置-f或-cf参数指定离线模型全网层信息文件。 -s参数与-r参数二者只能选择一个配置。 |
否 |
-s --select |
设定算子比对范围。通过指定算子的索引(网络模型中算子的ID)来选择需要比对的算子,格式为:-s 1,2,3(数值之间以逗号隔开,取值与网络模型中算子的ID有关)。 须先配置-f或-cf参数指定离线模型全网层信息文件。 -s参数与-r参数二者只能选择一个配置。 |
否 |
-max --max_cmp_size |
设置每个dump数据比对的最大字节数,用于精度比对过程提速,默认0(表示全量比较),单位Byte。当模型中算子的输出存在较大Shape时、比较过于耗时,可以尝试配置。 |
否 |
-overflow_detection |
整网算子溢出检测。进行整网比对时可检测溢出算子。 默认未开启算子溢出检测。 当算子的Tensor数据类型是fp16时,tensor中的任意一个数值的绝对值 >= 65504,认为算子溢出。 Caffe非量化原始模型 vs 量化原始模型场景配置本参数不生效。 |
否 |
单算子比对
单算子比对命令行格式如下:
python3 msaccucmp.py compare -m my_dump_path -g golden_dump_path [-f fusion_rule_file] [-cf close_fusion_rule_file] [-q quant_fusion_rule_file] [-out output] [-op op_name] [-o output_tensor] [-i input_tensor] [-c custom_script_path] [-v version] [-n topn] [--ignore_single_op_result] [-ml max_line] [-overflow_detection]
命令行参数说明如表2所示。
精度比对工具保存在$HOME/Ascend/ascend-toolkit/latest/tools/operator_cmp/compare目录下。
参数名 |
参数说明 |
是否必选 |
---|---|---|
-op --op_name |
单算子比对的算子名。输入待比对算子名,算子名获取方式有:
|
是 |
-o --output_tensor |
比对指定Index的output数据。 配置格式:-o Index,其中Index可以从整网比对结果文件中的TensorIndex字段的output取值获取,例如TensorIndex为trans_Cast_0:input:0,则Index为0。 当-o与-i均未配置时,默认比对output数据的Index为0的数据。 配置-op时有效,与-i参数互斥。 |
否 |
-i --input_tensor |
比对指定Index的input数据。 配置格式:-i Index,其中Index可以从整网比对结果文件中的TensorIndex字段的input取值获取,例如TensorIndex为trans_Cast_0:input:0,则Index为0。 配置-op时有效,与-o参数互斥。 |
否 |
-n --topn |
仅展示绝对误差和相对误差的前n条数据,比对完成后打屏展示并生成csv结果文件,取值范围为[1,10000],默认值为20。配置-op时有效。 生成的csv结果文件名分别为:
|
否 |
--ignore_single_op_result |
csv结果文件中不生成单算子比对的完整比对数据,即不生成完整比对结果的csv文件。配置-op时有效。 不配置本参数时,生成完整比对结果。 |
否 |
-ml --max_line |
单算子比对时生成的单个csv文件所包含最大的文件条数,取值范围为[10000,1000000],默认值为1000000。 文件中单算子的比对结果数据条数较大时,配置本参数可以将csv文件拆分为多个文件。比如数据条数为100000条,配置本参数为10000,那么比对结果则输出10个csv文件。 配置-op时有效,但配置--ignore_single_op_result时,本参数不生效。 |
否 |