调优完成后，请还原代码，并刷新算子编译缓存，即将ACL_OP_COMPILER_CACHE_MODE设置为force，使用方法示例如下。

import torch 
import torch_npu 
option = {"ACL_OP_COMPILER_CACHE_MODE":"force"} 
torch_npu.npu.set_option(option)

使用调优后的自定义知识库（如何使用请参见如何使用调优后的自定义知识库）重新训练，验证性能是否提高。

性能验证