aclnnWeightQuantBatchMatmul

该接口后续版本会废弃，请使用接口。

支持的产品型号

Atlas A2训练系列产品/Atlas 800I A2推理产品。

接口原型

，必须先调用“aclnnWeightQuantBatchMatmulGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小，再调用“aclnnWeightQuantBatchMatmul”接口执行计算。
- [object Object]
- [object Object]

功能描述

算子功能：伪量化用于对self * mat2（matmul/batchmatmul）中的mat2进行量化。
计算公式： $result = self@mat2+bias$

aclnnWeightQuantBatchMatmulGetWorkspaceSize

参数说明
- x1(aclTensor*, 计算输入)：公式中的输入[object Object]，数据类型支持FLOAT16，支持ND。不支持。维度仅支持二维不支持batch轴，与x2需满足broadcast关系。
- x2(aclTensor*, 计算输入)：经处理能得到公式中的输入[object Object]，数据类型支持INT8，支持ND。不支持。维度仅支持二维不支持batch轴，但与x1需满足broadcast关系。
- diagonalMatrix(aclTensor*, 计算输入)：对x2反量化得到公式中的输入[object Object]，数据类型支持INT8，支持ND。不支持。维度固定为二维，shape为（32， 32），为单位矩阵，m > 64时不参与计算且可以为空。
- deqOffset(aclTensor*, 计算输入)：对x2反量化得到公式中的输入[object Object]，由addOffset、antiquantOffset、antiquantScale计算得到，计算方式见示例代码，数据类型支持INT32，支持ND。不支持。shape支持 1 或者 n 或者（1， 1）或者（1， n）或者（n， 1），需和x2满足broadcast关系。m > 64时不参与计算且可以为空。
- deqScale(aclTensor*, 计算输入)：对x2反量化得到公式中的输入[object Object]，由接口aclnnTransQuantParam计算得到，计算方式见示例代码，数据类型支持UINT64，支持ND。不支持。shape支持 1 或者 n 或者（1， 1）或者（1， n）或者（n， 1），需和x2满足broadcast关系。m > 64时不参与计算且可以为空。
- addOffset(aclTensor*, 计算输入)：对x2反量化得到公式中的输入[object Object]，数据类型支持FLOAT16，支持ND。不支持。shape支持 1 或者 n 或者（1， 1）或者（1， n）或者（n， 1），需和x2满足broadcast关系。m < 64时不参与计算, 任意情况都可以为空。
- mulScale(aclTensor*, 计算输入)：对x2反量化得到公式中的输入[object Object]，数据类型支持FLOAT16，支持ND。不支持。shape支持 1 或者 n 或者（1， 1）或者（1， n）或者（n， 1），需和x2满足broadcast关系。m < 64时不参与计算, 任意情况都可以为空。
- bias(aclTensor*, 计算输入)：公式中的输入[object Object]，数据类型支持FLOAT，支持ND。不支持。维度为一维且值等于N，可以为空。
- transposeX1(bool, 计算输入)：用于描述x1是否转置。
- transposeX2(bool, 计算输入)：用于描述x2是否转置。
- antiquantScale(float, 计算输入)：对x2反量化得到公式中的输入[object Object]。
- antiquantOffset(float, 计算输入)：对x2反量化得到公式中的输入[object Object]。
- out(aclTensor*, 计算输出)：公式中的[object Object]，数据类型支持FLOAT16和INT8，且数据类型需要是x1与x2推导之后可转换的数据类型，shape需要是x1与x2 broadcast之后的shape。支持ND。
- workspaceSize(uint64_t*, 出参)：返回需要在Device侧申请的workspace大小。
- executor(aclOpExecutor**, 出参)：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

aclnnWeightQuantBatchMatmul

参数说明
- workspace(void*, 入参)：在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t, 入参)：在Device侧申请的workspace大小，由第一段接口aclnnWeightQuantBatchMatmulGetWorkspaceSize获取。
- executor(aclOpExecutor*, 入参)：op执行器，包含了算子计算流程。
- stream(aclrtStream, 入参)：指定执行任务的AscendCL Stream流。
返回值：

aclnnStatus：返回状态码，具体参见。

约束与限制

无

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]