文档
注册

NpuCompileInfo

ascendebug提供了NpuCompileInfo结构体,用于存储与NPU编译相关的编译信息,包括是否使能打印功能、核函数运行core数分配方式等信息。

具体定义如下:

@dataclass
class NpuCompileInfo():
    # 编译属性info
    dump_mode: str = ""
    syncall: bool = False
    task_ration: List[int] = field(default_factory=list)

关于结构体中成员的详细说明请参见表1

表1 NpuCompileInfo结构体成员说明

属性名

属性类型

默认值

属性说明

dump_mode

str

""

printf/PRINTF/DumpTensor/DumpAccChkPoint/assert打印功能的模式配置。

  • normal: 使能通用的打印功能。
  • acc_chk:使能偏移位置打印Tensor(DumpAccChkPoint功能)。
  • "":表示关闭打印功能。

syncall

bool

False

硬同步功能的使能开关,仅适用于Atlas A2训练系列产品/Atlas 800I A2推理产品

说明:
  • opc编译时,syncall属性值是编译的结果,用户需根据编译结果去设置。编译结果dict信息包含:
    • 关键字'cross_core_sync'值是bool类型,表示是否开启硬同步syncall。
    • 关键字'task_ration'值是list类型,表示核函数运行时的core分配方案。
  • ccec编译时,用户需自行设置。

task_ration

List[int]

[]

函数运行core数分配方式,格式为[n1, n2],例如task_ration=[1, 0], 表示“1:0”的分配方式。默认的[]表示使用系统默认格式。

说明:
  • opc编译时,syncall属性值是编译的结果,用户需根据编译结果去设置。编译结果dict信息包含:
    • 关键字'cross_core_sync'值是bool类型,表示是否开启硬同步syncall。
    • 关键字'task_ration'值是list类型,表示核函数运行时的core分配方案。
  • ccec编译时,用户需自行设置。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词