CompileNpuOptions
ascendebug提供了CompileNpuOptions类,用于存储NPU编译相关的可选配置项。
具体定义如下:
@dataclass class CompileNpuOptions(): dump_mode: str = "" simulator: bool = False pipe_all: bool = False syncall: bool = False task_ration: List[int] = field(default_factory=list) npu_compile_type: str = "opc" customize_tiling_so: str = "" memory_check: str = ""
关于类成员的详细说明请参见表1。
属性名 |
属性类型 |
默认值 |
属性说明 |
---|---|---|---|
dump_mode |
str |
"" |
printf/PRINTF/DumpTensor/DumpAccChkPoint/assert/时间戳打印功能的模式配置,与NpuCompileInfo.dump_mode配套使用。
|
simulator |
bool |
False |
是否开启仿真功能。默认关闭。
说明:
仅性能仿真调测场景的编译阶段才需开启本属性,否则影响后续执行过程。 |
pipe_all |
bool |
False |
是否开启PIPE_ALL功能。默认关闭。 |
syncall |
bool |
False |
硬同步功能的使能开关。一般适用于Atlas A2训练系列产品/Atlas 800I A2推理产品。
说明:
该参数仅在ops_adv算子工程场景设置后生效,且npu_compile_type必须为ccec编译方式。 |
task_ration |
List[int] |
[] |
设置核函数运行时的block数分配方式,例如task_ration=[1, 0], 表示“1:0”的分配方式。
说明:
该参数仅在ops_adv算子工程场景设置后生效,且npu_compile_type必须为ccec编译方式。 |
npu_compile_type |
str |
opc |
NPU编译方式。
说明:
该参数仅在ops_adv算子工程场景支持ccec和opc两种编译方式。核函数直调工程场景默认使用ccec,标准自定义算子工程场景默认使用opc。 |
customize_tiling_so |
str |
"" |
是否使用指定tiling.so(绝对路径)来编译Kernel文件。
说明:
|
memory_check |
str |
"" |
是否开启内存检测功能,与RunNpuOptions.memory_check配套使用。
说明:
|