下载
中文
注册

函数:infer_shape

C函数原型

aclError aclopInferShape(const char *opType, int numInputs, aclTensorDesc *inputDesc[], aclDataBuffer *inputs[], int numOutputs, aclTensorDesc *outputDesc[], aclopAttr *attr)

Python函数

ret = acl.op.infer_shape(op_type, in_desc_list, in_list, num_outputs, out_desc_list, attr)

函数功能

根据算子的输入Shape、输入值推导出算子的输出Shape。

输入说明

op_type:int,指定算子类型名称。

in_desc_list:list,算子输入Tensor的描述。需提前调用acl.create_tensor_desc接口创建aclTensorDesc类型。

in_list:list,算子输入Tensor。

此处算子输入Tensor数据的内存必须根据应用运行模式来确定,应用运行在Host时,此处需申请Host上的内存。应用运行在Device时,此处需申请Device上的内存。内存申请接口请参见内存管理

num_outputs:int,算子输出Tensor的数量。

attr:int,算子的属性地址对象。

返回值说明

out_desc_list:list,算子输出Tensor的描述。需提前调用acl.create_tensor_desc接口创建aclTensorDesc类型。“out_desc_list”列表中的元素个数必须与“num_outputs”参数值保持一致。

ret:int,错误码。

  • 返回0表示成功。
  • 返回其它值表示失败。

约束说明

  • 推导算子的输出Shape包含三种场景:
    • 根据Shape推导,可以得到算子的准确输出Shape,则返回准确输出Shape。
    • 根据Shape推导,无法得到算子的准确输出Shape,但可以得到输出Shape的范围,则在输出参数out_desc_list中将算子输出Tensor描述中的动态维度的维度值记为-1。该场景下,用户可调用get_tensor_desc_dim_range接口获取Tensor描述中指定维度的范围值。
    • (该场景预留)根据Shape推导,无法得到算子的准确输出Shape以及Shape范围,则在输出参数out_desc_list中将算子输出Tensor描述中的动态维度的维度值记为-2。
  • 如果算子有动态输入或动态输出,在调用acl.op.infer_shape接口推导算子的输出Shape前,需先调用set_tensor_desc_name接口设置所有输入和输出的Tensor描述的名称,且名称必须按照如下要求(算子IR原型中定义的输入/输出名称请参见算子清单。)
    • 对于必选输入、可选输入、必选输出,名称必须与算子IR原型中定义的输入/输出名称保持一致。
    • 对于动态输入、动态输出,名称必须是:算子IR原型中定义的输入/输出名称+编号。编号根据动态输入/输出的个数确定,从0开始,0对应第一个动态输入/输出,1对应第二个动态输入/输出,以此类推。

    例如某个算子有2个输入(第1个是必选输入x,第二个是动态输入y且输入个数为2)、1个必选输出z,则调用set_tensor_desc_name接口设置名称的代码示例如下:

    acl.set_tensor_desc_name(input_tensor_desc[0], "x");
    acl.set_tensor_desc_name(input_tensor_desc[1], "y0");
    acl.set_tensor_desc_name(input_tensor_desc[2], "y1");
    acl.set_tensor_desc_name(input_tensor_desc[0], "z");