简介
华为支持迁移用户原始网络,用于在Atlas 训练系列产品上执行训练,网络迁移可能会造成自有实现的算子运算结果与用业界标准算子(如TensorFlow、PyTorch)运算结果存在偏差,此时需要提供工具比对两者之间的差距,帮助开发人员快速解决算子精度问题。
精度比对工具能够定位到模型中算子的精度问题,提供比对Atlas 训练系列产品运算结果与原始网络基于GPU/CPU运算结果,以便确认误差发生的算子。
目前提供Vector比对能力,包含余弦相似度、最大绝对误差、累积相对误差、欧氏相对距离、KL散度、标准差的算法比对。
本文以HwHiAiUser普通用户安装、默认安装路径/home/HwHiAiUser/Ascend为例,介绍精度比对的操作方法,请根据实际情况替换。本文中举例路径均需要确保HwHiAiUser具有读或读写权限。
使用精度比对工具,请确保硬件环境满足要求:CPU 8核 2.6Ghz,内存16GB,否则有可能会造成比对缓慢。
精度比对支持的dump数据的类型:
- FLOAT
- FLOAT16
- DT_INT8
- DT_UINT8
- DT_INT16
- DT_UINT16
- DT_INT32
- DT_INT64
- DT_UINT32
- DT_UINT64
- DT_BOOL
- DT_DOUBLE
父主题: 精度比对工具使用指南(训练)