下载
中文
注册

Tiling调度优化功能

功能简介

Tiling过程描述了昇腾AI处理器上算子的输入/输出数据切分、分块计算、多核并行等策略,以满足片上存储限制和计算pipeline的需求,从而发挥硬件的极致性能。

静态Shape模型场景下,对于有Tiling值依赖的算子,如果不开启Tiling调度优化,Tiling计算会在Host CPU侧执行,执行完成后数据再拷贝到Device侧。如果开启Tiling调度优化,Tiling计算将直接在Device侧执行,从而实现静态Shape模型性能提升的目的。

使用方法

该功能通过torchair.get_npu_backend中compiler_config参数配置,配置示例如下,参数说明参见表1

1
2
3
4
5
6
import torch_npu
import torchair 
config = torchair.CompilerConfig()
# Tiling调度优化配置
config.experimental_config.tiling_schedule_optimize = True
npu_backend = torchair.get_npu_backend(compiler_config=config)
表1 参数说明

参数名

参数说明

是否必选

tiling_schedule_optimize

是否开启Tiling计算调度优化。

  • False(缺省值):不开启。
  • True:开启。