性能验证

调优完成后,请还原代码,并刷新算子编译缓存,即将ACL_OP_COMPILER_CACHE_MODE设置为force,使用方法示例如下。

import torch 
import torch_npu 
option = {"ACL_OP_COMPILER_CACHE_MODE":"force"} 
torch_npu.npu.set_option(option)

使用调优后的自定义知识库(如何使用请参见如何使用调优后的自定义知识库)重新训练,验证性能是否提高。