Tiling调度优化功能
功能简介
Tiling过程描述了昇腾AI处理器AI处理器SoCNPU IP加速器上算子的输入/输出数据切分、分块计算、多核并行等策略,以满足片上存储限制和计算pipeline的需求,从而发挥硬件的极致性能。
静态Shape模型场景下,对于有Tiling值依赖的算子,如果不开启Tiling调度优化,Tiling计算会在Host CPU侧执行,执行完成后数据再拷贝到Device侧。如果开启Tiling调度优化,Tiling计算将直接在Device侧执行,从而实现静态Shape模型性能提升的目的。
使用方法
该功能通过torchair.get_npu_backend中compiler_config参数配置,配置示例如下,参数说明参见表1。
1 2 3 4 5 6 |
import torch_npu import torchair config = torchair.CompilerConfig() # Tiling调度优化配置 config.experimental_config.tiling_schedule_optimize = True npu_backend = torchair.get_npu_backend(compiler_config=config) |
父主题: 更多功能