比对操作和分析

说明

前提条件

请确保完成使用前准备

整网全算法维度比对并输出专家建议

将网络模型中参与计算的所有算子进行精度比对。操作步骤如下:

  1. 登录CANN工具安装环境。
  2. 生成json格式的计算图文件。

    $HOME/Ascend/ascend-toolkit/latest/bin/atc --mode=5 --om=ge_proto_00005_Build.txt --json=ge_proto_00005_Build.txt.json

    .txt格式计算图文件获取请参见准备基于昇腾AI处理器运行生成的训练/在线推理网络dump数据和计算图文件

  3. 进入/home/HwHiAiUser/Ascend/ascend-toolkit/latest/tools/operator_cmp/compare目录。
  4. 执行比对命令。

    整网全算法维度比对样例
    python3 msaccucmp.py compare -m $HOME/output/20200808163566/0/ge_default_20200808163719_121/11/0 -g $HOME/output/Standard_tf/resnet50 -f $HOME/data/ge_proto_00005_Build.txt.json -out $HOME/result -alg all -advisor

    需要安装pandas 1.3或更高版本依赖,否则无法执行-advisor参数输出专家建议。

    表1 命令行参数说明

    参数名

    参数说明

    是否必选

    -m

    --my_dump_path

    基于昇腾AI处理器运行生成的训练网络dump数据文件所在目录,须指定dump数据文件所在的父目录。

    -g

    --golden_dump_path

    基于GPU运行生成的原始网络npy数据文件所在目录,须指定npy数据文件所在的父目录。

    -f

    --fusion_rule_file

    全网层信息文件。

    通过2使用ATC转换计算图文件生成的json文件。

    -out

    --output

    比对数据结果存放路径,默认为当前路径。

    -advisor

    在Tensor比对结束后,针对比对结果进行数据分析,给出专家建议。详情请参见比对结果专家建议

    比对结果如图1所示。
    图1 比对结果示例

    以上比对结果字段解释请参见完整比对结果参数说明

    若已知可能出现精度问题的范围或因大型网络模型输出结果文件数据量过大,可以通过配置参数来减少输出结果的数据量,更多参数详细介绍请参见命令格式说明

  5. 比对结果分析。

    请参见比对结果分析