GetMatmulApiTiling
功能说明
在编译期期间获取常量化的Matmul Tiling参数。
常量化的Tiling参数,指在调用获取MatmulConfig模板的接口时,使用常数值设置(baseM, baseN, baseK)或者(baseM, baseN, baseK, singleCoreM, singleCoreN, singleCoreK),这将得到带有设置为常量化参数的MatmulConfig模板,然后使用本接口,将Tiling信息常量化。本接口的返回值包含常量化的Matmul Tiling信息和MatmulConfig模板。
当在调用获取MatmulConfig模板的接口时,只用常数值设置(baseM, baseN, baseK),称为部分常量化,此时(singleCoreM, singleCoreN, singleCoreK)都保持默认值0,部分常量化场景在Kernel侧使用REGIST_MATMUL_OBJ初始化Matmul对象时,仍需要使用Tiling;用常数值设置(baseM, baseN, baseK, singleCoreM, singleCoreN, singleCoreK),称为全量常量化,这时可以在REGIST_MATMUL_OBJ的入参传递Tiling参数的位置,使用空指针替代。
函数原型
1 2 | template<class A_TYPE, class B_TYPE, class C_TYPE, class BIAS_TYPE> __aicore__ constexpr MatmulApiStaticTiling GetMatmulApiTiling(const MatmulConfig& mmCFG, int32_t l1Size = L1_SIZE) |
参数说明
参数名 |
描述 |
---|---|
A_TYPE |
A矩阵类型信息,通过MatmulType来定义。 |
B_TYPE |
B矩阵类型信息,通过MatmulType来定义。 |
C_TYPE |
C矩阵类型信息,通过MatmulType来定义。 |
BIAS_TYPE |
BIAS矩阵类型信息,通过MatmulType来定义。 |
参数名 |
输入/输出 |
描述 |
---|---|---|
mmCFG |
输入 |
获取的MatmulConfig模板。 对于 |
l1Size |
输入 |
可用的L1大小,默认值L1_SIZE。 |
支持的型号
注意事项
- 入参mmCFG,在调用获取MatmulConfig模板的接口获取时,需要使用常数值指定(baseM, baseN, baseK)或者指定(baseM, baseN, baseK, singleCoreM, singleCoreN, singleCoreK),并且指定的参数值需要和Tiling计算的值保持一致。
- Batch Matmul场景支持全量常量化,但不支持使用空指针替代REGIST_MATMUL_OBJ的入参Tiling。
调用示例
1 2 3 4 5 6 7 8 | //定义Matmul对象 typedef matmul::MatmulType<AscendC::TPosition::GM, CubeFormat::ND, half> aType; typedef matmul::MatmulType<AscendC::TPosition::GM, CubeFormat::ND, half> bType; typedef matmul::MatmulType<AscendC::TPosition::GM, CubeFormat::ND, float> cType; typedef matmul::MatmulType<AscendC::TPosition::GM, CubeFormat::ND, float> biasType; // 这里CFG使用GetNormalConfig接口获取,并指定已知的singleshape信息和baseM,baseN,baseK,指定的数值跟运行时tiling保持一致 constexpr auto staticTiling = GetMatmulApiTiling<aType, bType, cType, biasType>(CFG, 524288); matmul::Matmul<aType, bType, cType, biasType, staticTiling > mm; |