本场景主要包括以下子场景:
对于进行ATC转换后的离线模型,由于CANN软件版本迭代、模型版本迭代或模型进行优化,需要判断迭代、优化后的模型在昇腾AI处理器上运行是否存在精度下降问题。分为非量化 vs 非量化和量化 vs 量化,输入数据准备如下。
文件 |
说明 |
获取方式 |
---|---|---|
非量化离线模型在昇腾AI处理器上运行生成的dump数据文件(版本迭代前) |
标杆数据 |
离线推理场景各框架获取NPU环境的dump数据方法一致,请参考: |
非量化离线模型在昇腾AI处理器上运行生成的dump数据文件(版本迭代后) |
待比对数据 |
文件 |
说明 |
获取方式 |
---|---|---|
量化离线模型在昇腾AI处理器上运行生成的dump数据文件(版本迭代前) |
标杆数据 |
离线推理场景各框架获取NPU环境的dump数据方法一致,请参考: |
量化离线模型在昇腾AI处理器上运行生成的dump数据文件(版本迭代后) |
待比对数据 |
当同一离线模型切换了推理芯片,为了了解是否存在精度下降问题,那么可以将切换前的离线模型dump数据与切换后的离线模型dump数据进行比对。
例如在
参见准备离线模型文件执行,要求分别指定--soc_version,且跳过3,即两个模型均关闭算子融合转换离线模型,保证所有算子均可比对。
参见表3或表4获取,标杆数据为
参见比对操作和分析,需要取消-f和-cf参数,否则无法比对。
文件 |
说明 |
获取方式 |
---|---|---|
非量化离线模型在昇腾AI处理器上运行生成的dump数据文件(Ascend NPU A) |
标杆数据 |
离线推理场景各框架获取NPU环境的dump数据方法一致,请参考: |
非量化离线模型在昇腾AI处理器上运行生成的dump数据文件(Ascend NPU B) |
待比对数据 |
一般情况下,通过ATC工具转换离线模型时,会默认开启算子融合功能。那么需要判断融合前后的算子精度差异,就需要获取:
最后将以上两份数据进行精度比对。
该场景分为非量化开融合 vs 非量化关融合和量化开融合 vs 量化关融合,输入数据准备如下。
文件 |
说明 |
获取方式 |
---|---|---|
非量化离线模型文件(*.om)(关闭算子融合) 非量化离线模型文件(*.om)(开启算子融合) |
模型文件 |
|
非量化离线模型在昇腾AI处理器上运行生成的dump数据文件(关闭算子融合) |
标杆数据 |
离线推理场景各框架获取NPU环境的dump数据方法一致,请参考: |
非量化离线模型在昇腾AI处理器上运行生成的dump数据文件(开启算子融合) |
待比对数据 |
文件 |
说明 |
获取方式 |
---|---|---|
量化离线模型文件(*.om)(关闭算子融合) 量化离线模型文件(*.om)(开启算子融合) |
模型文件 |
|
量化离线模型(关闭算子融合)在昇腾AI处理器上运行生成的dump数据文件 |
标杆数据 |
离线推理场景各框架获取NPU环境的dump数据方法一致,请参考: |
量化离线模型(开启算子融合)在昇腾AI处理器上运行生成的dump数据文件 |
待比对数据 |