下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

precision_tool命令参考

ac -l [limit_num] (-c)

  • 命令说明:

    自动化检测命令,列出Fusion信息;解析算子溢出信息。-c:可选,进行全网比对;-l:可选,限制输出结果的条数(overflow解析的条数等)

  • 命令示例:

    PrecisionTool > ac -c

  • 执行结果:
    ╭─────────────────────────────────────────────────╮
    │ [TransData][327] trans_TransData_1170                                                            │
    │  - [AI Core][Status:32][TaskId:327] ['浮点计算有溢出']                                           │
    │  - First overflow file timestamp [1619347786532995] -                                            │
    │  |- TransData.trans_TransData_1170.327.1619347786532995.input.0.npy                              │
    │   |- [Shape: (32, 8, 8, 320)] [Dtype: bool] [Max: True] [Min: False] [Mean: 0.11950836181640626] │
    │  |- TransData.trans_TransData_1170.327.1619347786532995.output.0.npy                             │
    │   |- [Shape: (32, 20, 8, 8, 16)] [Dtype: bool] [Max: True] [Min: False] [Mean: 0.07781982421875] │ ╰─────────────────────────────────────────────────╯

run [command]

  • 命令说明:

    不退出交互命令环境执行shell命令,与内置命令不冲突的可以直接执行,否则需要加run前缀。

  • 命令示例:

    PrecisionTool > run vim cli.py

    PrecisionTool > vim cli.py

ls -n [op_name] -t [op_type] -f [fusion_pass] -k [kernel_name]

  • 命令说明:

    通过[算子名]/[算子类型]查询网络里的算子,模糊匹配。-n:算子节点名称;-t:算子类型;-f:融合类型;-k:kernel name。

  • 命令示例:

    PrecisionTool > ls -t Mul -n mul_3 -f TbeMulti

  • 执行结果
    [Mul][TbeMultiOutputFusionPass] InceptionV3/InceptionV3/Mixed_5b/Branch_1/mul_3
    [Mul][TbeMultiOutputFusionPass] InceptionV3/InceptionV3/Mixed_5c/Branch_1/mul_3
    [Mul][TbeMultiOutputFusionPass] InceptionV3/InceptionV3/Mixed_5d/Branch_1/mul_3
    [Mul][TbeMultiOutputFusionPass] InceptionV3/InceptionV3/Mixed_6b/Branch_1/mul_3

ni (-n) [op_name] -s [save sub graph deep]

  • 命令说明:

    通过[算子名]查询算子节点信息,-n:指定节点名称;-g:graph名称;-a:显示attr信息;-s:保存一个以当前算子节点为根,深度为参数值的子图。

  • 命令示例:

    PrecisionTool > ni gradients/InceptionV3/InceptionV3/Mixed_7a/Branch_0/Maximum_1_grad/GreaterEqual -s 3

  • 执行结果:
    ╭─────[GreaterEqual]gradients/InceptionV3/InceptionV3/Mixed_7a/Branch_0/Maximum_1_grad/GreaterEqual───────────────╮
    │ [GreaterEqual] gradients/InceptionV3/InceptionV3/Mixed_7a/Branch_0/Maximum_1_grad/GreaterEqual                                       │
    │ Input:                                                                                                                               │
    │  -[0][DT_FLOAT][NHWC][32, 8, 8, 320] InceptionV3/InceptionV3/Mixed_7a/Branch_0/add_3:0                                               │
    │  -[1][DT_FLOAT][NHWC][1, 8, 1, 1] InceptionV3/Mixed_7a/Branch_0/Conv2d_1a_3x3tau:0                                                   │
    │  -[2][][[]][] atomic_addr_clean0_21:-1                                                                                               │
    │ Output:                                                                                                                              │
    │  -[0][DT_BOOL][NHWC][32, 8, 8, 320] ['trans_TransData_1170']                                                                         │
    │ NpuDumpInput:                                                                                                                        │
    │  -[0] GreaterEqual.gradients_InceptionV3_InceptionV3_Mixed_7a_Branch_0_Maximum_1_grad_GreaterEqual.325.1619494134722860.input.0.npy  │
    │   |- [Shape: (32, 8, 8, 320)] [Dtype: float32] [Max: 5.846897] [Min: -8.368301] [Mean: -0.72565556]                                  │
    │  -[1] GreaterEqual.gradients_InceptionV3_InceptionV3_Mixed_7a_Branch_0_Maximum_1_grad_GreaterEqual.325.1619494134722860.input.1.npy  │
    │   |- [Shape: (1, 8, 1, 1)] [Dtype: float32] [Max: 0.0] [Min: 0.0] [Mean: 0.0]                                                        │
    │ NpuDumpOutput:                                                                                                                       │
    │  -[0] GreaterEqual.gradients_InceptionV3_InceptionV3_Mixed_7a_Branch_0_Maximum_1_grad_GreaterEqual.325.1619494134722860.output.0.npy │
    │   |- [Shape: (32, 8, 8, 320)] [Dtype: bool] [Max: True] [Min: False] [Mean: 0.1176300048828125]                                      │
    │ CpuDumpOutput:                                                                                                                       │
    │  -[0] gradients_InceptionV3_InceptionV3_Mixed_7a_Branch_0_Maximum_1_grad_GreaterEqual.0.1619492699305998.npy                         │
    │   |- [Shape: (32, 8, 8, 320)] [Dtype: bool] [Max: True] [Min: False] [Mean: 0.11764373779296874]                                     │
    ╰───────────────────────────────────────────────────────────────────╯
    2021-04-27 14:39:55 (15178) -[DEBUG]write 14953 bytes to './precision_data/dump/temp/op_graph/GreaterEqual.gradients_InceptionV3_InceptionV3_Mixed_7a_Branch_0_Maximum_1_grad_GreaterEqual.3.gv'
    2021-04-27 14:39:55 (15178) -[INFO]Sub graph saved to /root/sym/inception/precision_data/dump/temp/op_graph

pt (-n) [*.npy]

  • 命令说明

    查看某个dump数据块的数据信息,并保存到txt文件。-n:可选,待查看的数据文件名。

  • 命令示例:

    PrecisionTool > pt TransData.trans_TransData_1170.327.1619347786532995.input.0.npy

  • 执行结果:
    ╭────────────────────────────────────────────────────────────╮
    │ Shape: (32, 8, 8, 320)                                                                                                  │
    │ Dtype: bool                                                                                                             │
    │ Max: True                                                                                                               │
    │ Min: False                                                                                                              │
    │ Mean: 0.11950836181640626                                                                                               │
    │ Path: ./precision_data/dump/temp/overflow_decode/TransData.trans_TransData_1170.327.1619347786532995.input.0.npy        │
    │ TxtFile: ./precision_data/dump/temp/overflow_decode/TransData.trans_TransData_1170.327.1619347786532995.input.0.npy.txt │
    ╰────────────────────────────────────────────────────────────╯

cp (-n) [left *.npy] [right *.npy] -p [print num] -al [atol] -rl [rtol]

  • 命令说明:

    对比两个tensor的数据。

    -n:指定需要对比的两个numpy名;

    -p:指定输出的错误数据的个数及前多少个数据;

    -al/rl:指定相对误差的参数,在两个场景中用到:

    1. np.allclose(left, right, atol=al, rtol=rl)

    2. err_cnt += 1 if abs(data_left[i] - data_right[i]) > (al + rl * abs(data_right[i]))

    -s:保存成txt文件,默认打开

  • 命令示例:

    PrecisionTool > cp Add.InceptionV3_InceptionV3_Mixed_7a_Branch_0_add_3.323.1619494134703053.output.0.npy InceptionV3_InceptionV3_Mixed_7a_Branch_0_add_3.0.1619492699305998.npy -p 10 -s -al 0.002 -rl 0.005

  • 执行结果:
                      Error Item Table                                        Top Item Table
    ┏━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┓ ┏━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━┓
    ┃ Index ┃ Left          ┃ Right        ┃ Diff         ┃ ┃ Index ┃ Left        ┃ Right       ┃ Diff          ┃
    ┡━━━━━━━╇━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━┩ ┡━━━━━━━╇━━━━━━━━━━━━━╇━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━┩
    │ 155   │ 0.024600908   │ 0.022271132  │ 0.002329776  │ │ 0     │ -0.9206961  │ -0.9222216  │ 0.0015255213  │
    │ 247   │ 0.015752593   │ 0.017937578  │ 0.0021849852 │ │ 1     │ -0.6416973  │ -0.64051837 │ 0.0011789203  │
    │ 282   │ -0.0101207765 │ -0.007852031 │ 0.0022687456 │ │ 2     │ -0.35383835 │ -0.35433492 │ 0.0004965663  │
    │ 292   │ 0.019581757   │ 0.02240482   │ 0.0028230622 │ │ 3     │ -0.18851271 │ -0.18883198 │ 0.00031927228 │
    │ 640   │ -0.06593232   │ -0.06874806  │ 0.0028157383 │ │ 4     │ -0.43508735 │ -0.43534422 │ 0.00025686622 │
    │ 1420  │ 0.09293677    │ 0.09586689   │ 0.0029301196 │ │ 5     │ 1.4447614   │ 1.4466647   │ 0.0019032955  │
    │ 1462  │ -0.085207745  │ -0.088047795 │ 0.0028400496 │ │ 6     │ -0.3455438  │ -0.3444429  │ 0.0011008978  │
    │ 1891  │ -0.03433288   │ -0.036525503 │ 0.002192624  │ │ 7     │ -0.6560242  │ -0.6564579  │ 0.0004336834  │
    │ 2033  │ 0.06828873    │ 0.07139922   │ 0.0031104907 │ │ 8     │ -2.6964858  │ -2.6975214  │ 0.0010356903  │
    │ 2246  │ -0.06376442   │ -0.06121233  │ 0.002552092  │ │ 9     │ -0.73746175 │ -0.73650354 │ 0.00095820427 │
    └───────┴───────────────┴──────────────┴──────────────┘ └───────┴─────────────┴─────────────┴───────────────┘
    ╭──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╮
    │ Left:                                                                                                                                    │
    │  |- NpyFile: ./precision_data/dump/temp/decode/Add.InceptionV3_InceptionV3_Mixed_7a_Branch_0_add_3.323.1619494134703053.output.0.npy     │
    │  |- TxtFile: ./precision_data/dump/temp/decode/Add.InceptionV3_InceptionV3_Mixed_7a_Branch_0_add_3.323.1619494134703053.output.0.npy.txt │
    │  |- NpySpec: [Shape: (32, 8, 8, 320)] [Dtype: float32] [Max: 5.846897] [Min: -8.368301] [Mean: -0.72565556]                              │
    │ DstFile:                                                                                                                                 │
    │  |- NpyFile: ./precision_data/dump/cpu/InceptionV3_InceptionV3_Mixed_7a_Branch_0_add_3.0.1619492699305998.npy                            │
    │  |- TxtFile: ./precision_data/dump/cpu/InceptionV3_InceptionV3_Mixed_7a_Branch_0_add_3.0.1619492699305998.npy.txt                        │
    │  |- NpySpec: [Shape: (32, 8, 8, 320)] [Dtype: float32] [Max: 5.8425903] [Min: -8.374472] [Mean: -0.7256237]                              │
    │ NumCnt:   655360                                                                                                                         │
    │ AllClose: False                                                                                                                          │
    │ CosSim:   0.99999493                                                                                                                     │
    │ ErrorPer: 0.023504638671875  (rl= 0.005, al= 0.002)                                                                                      │
    ╰──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╯

vcs -f [file_name] -c [cos_sim_threshold] -l [limit]

  • 命令说明:

    查看精度比对结果的概要信息,可以根据余弦相似度阈值过滤出低于阈值的算子/信息

    -f (--file) 可选,指定csv文件,不设置则默认遍历precision_data/temp/vector_compare/目录下最近产生的对比目录内的所有csv

    -c (--cos_sim) 可选,指定筛选所使用的余弦相似度阈值,默认0.98

    -l (--limit) 可选,指定输出前多少个结果,默认值3

  • 命令示例:

    PrecisionTool > vcs -c 0.98 -l 2

  • 执行结果:
     2021-05-31 14:48:56 (2344298) -[INFO]Sub path num:[1]. Dirs[['20210529145750']], choose[20210529145750]
     2021-05-31 14:48:56 (2344298) -[DEBUG]Find ['result_20210529145751.csv', 'result_20210529145836.csv', 'result_20210529145837.csv', 'result_20210529145849.csv', 'result_20210529150404.csv', 'result_20210529151102.csv'] result files in dir precision_data/temp/vector_compare/20210529145750
     2021-05-31 14:48:56 (2344298) -[INFO]Find 0 ops less then 0.98 in precision_data/temp/vector_compare/20210529145750/result_20210529145751.csv
     2021-05-31 14:48:56 (2344298) -[INFO]Find 0 ops less then 0.98 in precision_data/temp/vector_compare/20210529145750/result_20210529145836.csv
     2021-05-31 14:48:56 (2344298) -[INFO]Find 1 ops less then 0.98 in precision_data/temp/vector_compare/20210529145750/result_20210529145837.csv
     2021-05-31 14:48:56 (2344298) -[INFO]Find 2 ops less then 0.98 in precision_data/temp/vector_compare/20210529145750/result_20210529145849.csv
     2021-05-31 14:48:56 (2344298) -[INFO]Find 2 ops less then 0.98 in precision_data/temp/vector_compare/20210529145750/result_20210529150404.csv
     2021-05-31 14:48:56 (2344298) -[INFO]Find 0 ops less then 0.98 in precision_data/temp/vector_compare/20210529145750/result_20210529151102.csv
     ╭── [578] pixel_cls_loss/cond_1/TopKV2 ───╮
     │ Left:  ['pixel_cls_loss/cond_1/TopKV2']       │
     │ Right: ['pixel_cls_loss/cond_1/TopKV2']       │
     │ Input:                                        │
     │  - [0]1.0        - [1]nan                     │
     │ Output:                                       │
     │  - [0]0.999999   - [1]0.978459                │
     ╰───────────────────────╯
     ╭── [490] gradients/AddN_5 ───╮
     │ Left:  ['gradients/AddN_5']       │
     │ Right: ['gradients/AddN_5']       │
     │ Input:                            │
     │  - [0]nan        - [1]1.0         │
     │ Output:                           │
     │  - [0]0.05469                     │
     ╰─────────────────╯

vc -lt [left_path] -rt [right_path] -g [graph]

  • 命令说明:

    手动指定两个目录,进行整网精度比对。

    -lt 必选,其中一个文件目录

    -rt 必选,另一个目录,一般指标杆目录

    需要指定到dump数据所在的目录层级,例如:precision_data/npu/debug_0/dump/20220217095546/3/ge_default_20220217095547_1/1/0/

    -g 可选,指定-g将尝试解析graph内的映射关系比对(一般用于NPU和TF之间的数据比对,NPU与NPU之间比对不需要,直接按照算子name对比)

  • 命令示例:

    PrecisionTool > vc -lt /path/left -rt /path/right

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词