调优完成后,请还原代码,并刷新算子编译缓存,即将ACL_OP_COMPILER_CACHE_MODE设置为force,使用方法示例如下。
import torch import torch_npu option = {"ACL_OP_COMPILER_CACHE_MODE":"force"} torch_npu.npu.set_option(option)
使用调优后的自定义知识库(如何使用请参见如何使用调优后的自定义知识库)重新训练,验证性能是否提高。