使用说明
Ascend C提供一组Matmul Tiling API,方便用户获取Matmul kernel计算时所需的Tiling参数。您只需要传入A/B/C矩阵等信息,调用API接口,即可获取到Init中TCubeTiling结构体中的相关参数。
Matmul Tiling API分为Matmul单核Tiling接口、多核Tiling接口和BatchMatmul Tiling接口。获取Tiling参数的流程如下:
- 创建一个单核Tiling对象,或多核Tiling对象,或BatchMatmul Tiling对象。
- 设置A、B、C、Bias的参数类型信息;M、N、Ka、Kb形状信息等。
- 调用GetTiling接口,获取Tiling信息。
使用Matmul单核Tiling接口、多核Tiling接口和BatchMatmul Tiling接口获取Tiling参数的样例如下:
- Matmul单核Tiling
auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); MatmulApiTiling tiling(ascendcPlatform); tiling.SetAType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(1024, 1024, 1024); tiling.SetOrgShape(1024, 1024, 1024); //或Ka,Kb不等长,如tiling.SetOrgShape(1024, 1024, 1024, 1280) tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); // 设定允许使用的空间,缺省使用该AI处理器所有空间 optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData); // if ret = -1, get tiling failed
- 多核Tiling
auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); MultiCoreMatmulTiling tiling(ascendcPlatform); tiling.SetDim(1); tiling.SetAType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(1024, 1024, 1024); tiling.SetSingleShape(1024, 1024, 1024); tiling.SetOrgShape(1024, 1024, 1024); tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); // 设定允许使用的空间,缺省使用该AI处理器所有空间 optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData); // if ret = -1, get tiling failed
- BatchMatmul Tiling
auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); BatchMatmulTiling bmmTiling(ascendcPlatform); bmmTiling.SetDim(1); bmmTiling.SetAType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); bmmTiling.SetBType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); bmmTiling.SetCType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); bmmTiling.SetBiasType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); bmmTiling.SetBias(true); bmmTiling.SetShape(1024, 1024, 1024); bmmTiling.SetSingleShape(1024, 1024, 1024); bmmTiling.SetOrgShape(1024, 1024, 1024); bmmTiling.SetBatch(8, 8, 8); bmmTiling.SetSingleBatch(8, 8, 8); bmmTiling.SetBufferSpace(-1, -1, -1); // 设定允许使用的空间,缺省使用该AI处理器所有空间 optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData); // if ret = -1, get tiling failed
接口列表如下:
接口 |
功能 |
---|---|
SetAType |
设置A矩阵的位置,数据格式,数据类型,是否转置等信息。 |
SetBType |
设置B矩阵的位置,数据格式,数据类型,是否转置等信息。 |
SetCType |
设置C矩阵的位置,数据格式,数据类型等信息。 |
SetBiasType |
设置Bias的位置,数据格式,数据类型等信息。 |
SetShape |
设置Matmul单次计算的形状singleM、singleN、singleK,单位为元素个数。 |
SetOrgShape |
设置Matmul计算时的原始完整的形状M、N、Ka, Kb,单位为元素个数。 |
SetBias |
设置Bias是否参与运算。 |
SetFixSplit |
设置固定的baseM、baseN、baseK,单位为元素个数。 |
SetBufferSpace |
设置Matmul计算时可用的L1/L0C/UB空间大小,单位为字节。 |
SetTraverse |
设置遍历方式,M轴优先还是N轴优先。 |
SetMadType |
设置是否使能HF32模式。当前版本暂不支持。 |
SetSplitRange |
设置baseM/baseN/baseK的最大值和最小值。 |
SetDoubleBuffer |
设置A/B/C/Bias是否使能double buffer功能,以及是否需要做ND2NZ或者NZ2ND的转换。该接口为预留接口,当前版本暂不支持。 |
GetBaseM |
获取baseM值。 |
GetBaseN |
获取baseN值。 |
GetBaseK |
获取baseK值。 |
GetTiling |
获取Tiling参数。 |
接口 |
功能 |
---|---|
SetDim |
设置多核Matmul时,可以参与运算的核数。 |
SetSingleRange |
设置singleCoreM/singleCoreN/singleCoreK的最大值与最小值。 |
SetSingleShape |
设置Matmul单核计算的形状singleCoreM、singleCoreN、singleCoreK,单位为元素个数。 |
GetSingleShape |
获取计算后的singleCoreM/singleCoreN/singleCoreK。 |
SetAlignSplit |
设置多核切分时singleCoreM/singleCoreN/singleCoreK的对齐值 |
GetCoreNum |
获得多核切分后, 使用的BlockDim。 |
接口 |
功能 |
---|---|
GetCoreNum |
获得多核切分后, 使用的BlockDim。 |