下载
中文
注册

图模式编译节点遍历选项

功能简介

图模式下算子编译时,可以设置不同的图遍历顺序,对静态图内存使用有不同的影响。用户根据实际情况自行设置。

该功能主要面向推理场景。

使用方法

该功能通过torchair.get_npu_backend中compiler_config参数配置,配置示例如下,参数说明参见表1

1
2
3
4
5
6
import torch_npu
import torchair 
config = torchair.CompilerConfig()
# 图模式编译的遍历策略配置
config.experimental_config.topology_sorting_strategy = "DFS"
npu_backend = torchair.get_npu_backend(compiler_config=config)
表1 参数说明

参数名

参数说明

是否必选

topology_sorting_strategy

图执行时是否开启计算与通信并行。

  • DFS(缺省值):Depth First Search,深度优先遍历策略。
  • BFS:Breadth First Search,广度优先遍历策略。
  • RDFS:Reverse DFS,反向深度优先遍历策略。
  • StableRDFS:稳定拓扑序策略,针对图里已有的算子,不会改变其计算顺序;针对图里新增的算子,使用RDFS遍历策略。