Tiling调度优化功能

功能简介

Tiling过程描述了昇腾AI处理器上算子的输入/输出数据切分、分块计算、多核并行等策略，以满足片上存储限制和计算pipeline的需求，从而发挥硬件的极致性能。

静态Shape模型场景下，对于有Tiling值依赖的算子，如果不开启Tiling调度优化，Tiling计算会在Host CPU侧执行，执行完成后数据再拷贝到Device侧。如果开启Tiling调度优化，Tiling计算将直接在Device侧执行，从而实现静态Shape模型性能提升的目的。

使用方法

该功能通过torchair.get_npu_backend中compiler_config参数配置，配置示例如下，参数说明参见表1。

import torch_npu
import torchair 
config = torchair.CompilerConfig()
# Tiling调度优化配置
config.experimental_config.tiling_schedule_optimize = True
npu_backend = torchair.get_npu_backend(compiler_config=config)

表1 参数说明
参数名	参数说明	是否必选
tiling_schedule_optimize	是否开启Tiling计算调度优化。 False（缺省值）：不开启。 True：开启。	否

父主题： 更多功能