SetMatmulConfigParams
功能说明
在计算Tiling时,调用GetTiling接口前,用于自定义设置表1中的MatmulConfig参数。本接口中配置的参数对应的功能在Tiling与Kernel中需要保持一致,所以本接口中参数的使能或参数值,需要与Kernel侧对应的MatmulConfig参数值保持一致,详细MatmulConfig参数请见表2。
函数原型
1 | void SetMatmulConfigParams(int32_t mmConfigTypeIn = 1, bool enableL1CacheUBIn = false, ScheduleType scheduleTypeIn = ScheduleType::INNER_PRODUCT, MatrixTraverse traverseIn = MatrixTraverse::NOSET, bool enVecND2NZIn = false) |
1 | void SetMatmulConfigParams(const MatmulConfigParams& configParams) |
参数说明
参数名 |
输入/输出 |
描述 |
||
---|---|---|---|---|
mmConfigTypeIn |
输入 |
设置Matmul的模板类型,需要与Matmul对象创建的模板一致,当前只支持配置为0或1。
|
||
enableL1CacheUBIn |
输入 |
配置是否使能L1缓存UB计算块;参考使能场景:MTE3和MTE2流水串行较多的场景。
|
||
scheduleTypeIn |
输入 |
配置Matmul数据搬运模式。参数取值如下:
|
||
traverseIn |
输入 |
Matmul做矩阵运算的循环迭代顺序,即一次迭代计算出[baseM, baseN]大小的C矩阵分片后,自动偏移到下一次迭代输出的C矩阵位置的偏移顺序。参数取值如下:
|
||
enVecND2NZIn |
输入 |
是否使能ND2NZ |
||
configParams |
输入 |
config相关参数,类型为MatmulConfigParams,结构体具体定义如下。其中的参数说明请参考表2。
|
参数名称 |
含义 |
||
---|---|---|---|
mmConfigType |
设置Matmul的模板类型,需要与Matmul对象创建的模板一致,当前只支持配置为0或1。
|
||
enableL1CacheUB |
配置是否使能L1缓存UB计算块;参考使能场景:MTE3和MTE2流水串行较多的场景。
|
||
scheduleType |
配置Matmul数据搬运模式。参数取值如下:
|
||
traverse |
Matmul做矩阵运算的循环迭代顺序,即一次迭代计算出[baseM, baseN]大小的C矩阵分片后,自动偏移到下一次迭代输出的C矩阵位置的偏移顺序。参数取值如下:
|
||
enVecND2NZ |
是否使能ND2NZ |
返回值
无
注意事项
无
调用示例
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(1024, 1024, 1024); tiling.SetOrgShape(1024, 1024, 1024); tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); tiling.SetMatmulConfigParams(0); // 额外设置 // tiling.SetMatmulConfigParams({1, false, ScheduleType::OUTER_PRODUCT, MatrixTraverse::FIRSTM}); optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData); |