下载
中文
注册

aclGenGraphAndDumpForOp

函数功能

构建单个算子的图并Dump,生成.txt文件。此处的图是指表达算子IR(Intermediate Representation)的结构,图编译过程中由于融合、拆分等原因会导致图不断变换、进而生成新的图,这些变换的目的是为了将用户表达的图适配到昇腾AI处理器上,获得更高性能。

使用场景

算子调优场景下,调用本接口构建单个算子的图并Dump,生成.txt文件,作为算子调优的输入数据之一。

对于不涉及构建图的场景(例如单算子API执行),无需使用该接口。

函数原型

aclError aclGenGraphAndDumpForOp(const char *opType,

int numInputs,

const aclTensorDesc *const inputDesc[],

const aclDataBuffer *const inputs[],

int numOutputs,

const aclTensorDesc *const outputDesc[],

aclDataBuffer *const outputs[],

const aclopAttr *attr,

aclopEngineType engineType,

const char *graphDumpPath,

const aclGraphDumpOption *graphDumpOpt)

参数说明

参数名

输入/输出

说明

opType

输入

指定算子类型名称的指针。

numInputs

输入

算子输入tensor的数量。

inputDesc

输入

算子输入tensor描述的指针数组。

需提前调用aclCreateTensorDesc接口创建aclTensorDesc类型。

inputDesc数组中的元素个数必须与numInputs参数值保持一致,且inputs数组与inputDesc数组中的元素必须一一对应。

inputs

输入

算子输入tensor的指针数组。

需提前调用aclCreateDataBuffer接口创建aclDataBuffer类型的数据。

inputs数组中的元素个数必须与numInputs参数值保持一致,且inputs数组与inputDesc数组中的元素必须一一对应。

numOutputs

输入

算子输出tensor的数量。

outputDesc

输入

算子输出tensor描述的指针数组。

需提前调用aclCreateTensorDesc接口创建aclTensorDesc类型。

outputDesc数组中的元素个数必须与numOutputs参数值保持一致,且outputs数组与outputDesc数组中的元素必须一一对应。

outputs

输入

算子输出tensor的指针数组。

需提前调用aclCreateDataBuffer接口创建aclDataBuffer类型的数据。

outputs数组中的元素个数必须与numOutputs参数值保持一致,且outputs数组与outputDesc数组中的元素必须一一对应。

attr

输入

算子属性的指针。

需提前调用aclopCreateAttr接口创建aclopAttr类型。

engineType

输入

算子执行引擎。

graphDumpPath

输入

Dump单算子图所生成的文件(文件名后缀为.txt)的保存路径的指针。

路径需要由用户提前创建,路径中如果不指定文件名,则由AscendCL内部指定文件名。

如果多次Dump时,指定同一个路径,且文件名相同,则最新一次的文件会覆盖之前的文件。

graphDumpOpt

输入

单算子图的dump选项的指针。

当前该参数预留,仅支持传入nullptr。

返回值说明

返回0表示成功,返回其他值表示失败。