文档
注册

CompileNpuOptions

ascendebug提供了CompileNpuOptions结构体,用于存储NPU编译相关的可选配置信息。

具体定义如下:

@dataclass
class CompileNpuOptions():
    dump_mode: str = ""
    simulator: bool = False
    pipe_all: bool = False
    syncall: bool = False
    task_ration: List[int] = field(default_factory=list)
    npu_compile_type: str = "opc"
    memory_check: str = ""

关于结构体中成员的详细说明请参见表1

表1 CompileNpuOptions结构体成员说明

属性名

属性类型

默认值

属性说明

dump_mode

str

""

printf/PRINTF/DumpTensor/DumpAccChkPoint/assert打印功能的模式配置。

  • normal: 使能通用的打印功能。
  • acc_chk:使能偏移位置打印Tensor(DumpAccChkPoint功能)。
  • "":表示关闭打印功能。

simulator

bool

False

是否开启仿真功能。默认关闭。

说明:

仅性能仿真调测场景的编译阶段才需开启本属性,否则影响后续执行过程。

pipe_all

bool

False

是否开启PIPE_ALL功能。默认关闭。

syncall

bool

False

硬同步功能的使能开关。一般适用于Atlas A2训练系列产品/Atlas 800I A2推理产品

说明:

该参数仅在ops_adv算子工程场景设置后生效,且npu_compile_type必须为ccec编译方式。

task_ration

str

""

设置核函数运行时的block数分配方式,例如:"1:1"。

说明:

该参数仅在ops_adv算子工程场景设置后生效,且npu_compile_type必须为ccec编译方式。

npu_compile_type

str

opc

NPU编译方式。

  • opc:Ascend C框架自带的编译方式。
  • ccec:本工具基于毕昇编译器自动拼接编译选项得到的编译方式,毕昇编译器介绍参见毕昇编译器使用指南
说明:

该参数仅在ops_adv算子工程场景支持ccec和opc两种编译方式。核函数直调工程场景默认使用ccec,标准自定义算子工程场景默认使用opc。

memory_check

str

""

是否开启内存检测功能,仅适用于Atlas A2训练系列产品/Atlas 800I A2推理产品的NPU调测场景。同时与dump_mode参数冲突,不支持同时开启。

  • ""或None:默认不开启。
  • oom:开启oom内存越界检测功能。
说明:
  • 该参数在核函数直调工程场景不生效。
  • 该参数在标准自定义算子工程场景、ops_adv算子工程场景(且npu_compile_type为opc编译模式)生效。

customize_tiling_so

str

""

是否使用指定tiling.so(绝对路径)来编译Kernel文件。

  • ""或None:默认不开启。
  • so文件的绝对路径名:采用该so文件解析出注册算子的Tiling结构,并用于OPC编译
说明:
  • 该参数在核函数直调工程场景不生效。
  • 该参数在标准自定义算子工程场景、ops_adv算子工程场景(且npu_compile_type为opc编译模式)生效。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词