下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

CompileNpuOptions

ascendebug提供了CompileNpuOptions类,用于存储NPU编译相关的可选配置项。

具体定义如下:

@dataclass
class CompileNpuOptions():
    dump_mode: str = ""
    simulator: bool = False
    pipe_all: bool = False
    syncall: bool = False
    task_ration: List[int] = field(default_factory=list)
    npu_compile_type: str = "opc"
    customize_tiling_so: str = ""
    memory_check: str = ""
   

关于类成员的详细说明请参见表1

表1 CompileNpuOptions成员说明

属性名

属性类型

默认值

属性说明

dump_mode

str

""

printf/PRINTF/DumpTensor/DumpAccChkPoint/assert/时间戳打印功能的模式配置,与NpuCompileInfo.dump_mode配套使用。

  • normal: 使能通用的打印功能。
  • acc_chk:使能偏移位置打印Tensor(DumpAccChkPoint功能)。
  • time_stamp:时间戳打点功能。(Atlas A2训练系列产品/Atlas 800I A2推理产品
  • "":表示关闭打印功能。

simulator

bool

False

是否开启仿真功能。默认关闭。

说明:

仅性能仿真调测场景的编译阶段才需开启本属性,否则影响后续执行过程。

pipe_all

bool

False

是否开启PIPE_ALL功能。默认关闭。

syncall

bool

False

硬同步功能的使能开关。一般适用于Atlas A2训练系列产品/Atlas 800I A2推理产品

说明:

该参数仅在ops_adv算子工程场景设置后生效,且npu_compile_type必须为ccec编译方式。

task_ration

List[int]

[]

设置核函数运行时的block数分配方式,例如task_ration=[1, 0], 表示“1:0”的分配方式。

说明:

该参数仅在ops_adv算子工程场景设置后生效,且npu_compile_type必须为ccec编译方式。

npu_compile_type

str

opc

NPU编译方式。

  • opc:Ascend C框架自带的编译方式。
  • ccec:本工具基于毕昇编译器自动拼接编译选项得到的编译方式,毕昇编译器介绍参见毕昇编译器使用指南
说明:

该参数仅在ops_adv算子工程场景支持ccec和opc两种编译方式。核函数直调工程场景默认使用ccec,标准自定义算子工程场景默认使用opc。

customize_tiling_so

str

""

是否使用指定tiling.so(绝对路径)来编译Kernel文件。

  • ""或None:默认不开启。
  • so文件的绝对路径名:采用该so文件解析出注册算子的Tiling结构,并用于OPC编译
说明:
  • 该参数在核函数直调工程场景不生效。
  • 该参数在标准自定义算子工程场景、ops_adv算子工程场景(且npu_compile_type为opc编译模式)生效。

memory_check

str

""

是否开启内存检测功能,与RunNpuOptions.memory_check配套使用。

  • ""或None:默认不开启
  • oom:开启内存异常检测,主要检测内存泄漏、非法释放、非法读写、越界访问。(仅支持Atlas A2训练系列产品/Atlas 800I A2推理产品
  • oob:开启内存异常检测,主要检测越界访问。(支持Atlas A2训练系列产品/Atlas 800I A2推理产品Atlas 推理系列产品
说明:
  • dump_mode参数冲突,不支持同时开启。
  • 仅在标准自定义算子工程、ops_adv算子工程场景下,且npu_compile_type为opc编译模式,该参数生效。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词