下载
中文
注册

GetMatmulApiTiling

功能说明

在编译期期间获取常量化的Matmul Tiling参数。

常量化的Tiling参数,指在调用获取MatmulConfig模板的接口时,使用常数值设置(baseM, baseN, baseK)或者(baseM, baseN, baseK, singleCoreM, singleCoreN, singleCoreK),这将得到带有设置为常量化参数的MatmulConfig模板,然后使用本接口,将Tiling信息常量化。本接口的返回值包含常量化的Matmul Tiling信息和MatmulConfig模板。

当在调用获取MatmulConfig模板的接口时,只用常数值设置(baseM, baseN, baseK),称为部分常量化,此时(singleCoreM, singleCoreN, singleCoreK)都保持默认值0,部分常量化场景在Kernel侧使用REGIST_MATMUL_OBJ初始化Matmul对象时,仍需要使用Tiling;用常数值设置(baseM, baseN, baseK, singleCoreM, singleCoreN, singleCoreK),称为全量常量化,这时可以在REGIST_MATMUL_OBJ的入参传递Tiling参数的位置,使用空指针替代。

函数原型

1
2
template<class A_TYPE, class B_TYPE, class C_TYPE, class BIAS_TYPE>
__aicore__ constexpr MatmulApiStaticTiling GetMatmulApiTiling(const MatmulConfig& mmCFG, int32_t l1Size = L1_SIZE)

参数说明

表1 模板参数说明

参数名

描述

A_TYPE

A矩阵类型信息,通过MatmulType来定义。

B_TYPE

B矩阵类型信息,通过MatmulType来定义。

C_TYPE

C矩阵类型信息,通过MatmulType来定义。

BIAS_TYPE

BIAS矩阵类型信息,通过MatmulType来定义。

表2 参数说明

参数名

输入/输出

描述

mmCFG

输入

获取的MatmulConfig模板。

对于Atlas A2 训练系列产品/Atlas 800I A2 推理产品,支持常量化的模板有:Norm, MDL模板。

l1Size

输入

可用的L1大小,默认值L1_SIZE。

支持的型号

Atlas A2 训练系列产品/Atlas 800I A2 推理产品

注意事项

  • 入参mmCFG,在调用获取MatmulConfig模板的接口获取时,需要使用常数值指定(baseM, baseN, baseK)或者指定(baseM, baseN, baseK, singleCoreM, singleCoreN, singleCoreK),并且指定的参数值需要和Tiling计算的值保持一致。
  • Batch Matmul场景支持全量常量化,但不支持使用空指针替代REGIST_MATMUL_OBJ的入参Tiling。

调用示例

1
2
3
4
5
6
7
8
//定义Matmul对象
typedef matmul::MatmulType<AscendC::TPosition::GM, CubeFormat::ND, half> aType; 
typedef matmul::MatmulType<AscendC::TPosition::GM, CubeFormat::ND, half> bType; 
typedef matmul::MatmulType<AscendC::TPosition::GM, CubeFormat::ND, float> cType; 
typedef matmul::MatmulType<AscendC::TPosition::GM, CubeFormat::ND, float> biasType; 
// 这里CFG使用GetNormalConfig接口获取,并指定已知的singleshape信息和baseM,baseN,baseK,指定的数值跟运行时tiling保持一致
constexpr auto staticTiling = GetMatmulApiTiling<aType, bType, cType, biasType>(CFG, 524288);
matmul::Matmul<aType, bType, cType, biasType, staticTiling > mm;