SetCLayout
功能说明
调用IterateBatch接口之前,需要在host侧Tiling实现中通过本接口设置C矩阵的Layout轴信息,包括B、S、N、G、D轴。
函数原型
1
|
int32_t SetCLayout(int32_t B, int32_t S, int32_t N, int32_t G, int32_t D) |
参数说明
参数名 |
输入/输出 |
描述 |
---|---|---|
B |
输入 |
C矩阵Layout的B轴信息 |
S |
输入 |
C矩阵Layout的S轴信息 |
N |
输入 |
C矩阵Layout的N轴信息 |
G |
输入 |
C矩阵Layout的G轴信息 |
D |
输入 |
C矩阵Layout的D轴信息 |
返回值
-1表示设置失败; 0表示设置成功。
注意事项
无
调用示例
auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()) MultiCoreMatmulTiling tiling(ascendcPlatform); int32_t M = 32; int32_t N = 256; int32_t K = 64; tiling->SetDim(1); tiling->SetAType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling->SetBType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling->SetCType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling->SetBiasType(TPosition::GM, CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling->SetShape(M, N, K); tiling->SetOrgShape(M, N, K); tiling->SetBias(true); tiling->SetBufferSpace(-1, -1, -1); constexpr int32_t A_BNUM = 2; constexpr int32_t A_SNUM = 32; constexpr int32_t A_GNUM = 3; constexpr int32_t A_DNUM = 64; constexpr int32_t B_BNUM = 2; constexpr int32_t B_SNUM = 256; constexpr int32_t B_GNUM = 3; constexpr int32_t B_DNUM = 64; constexpr int32_t C_BNUM = 2; constexpr int32_t C_SNUM = 32; constexpr int32_t C_GNUM = 3; constexpr int32_t C_DNUM = 256; constexpr int32_t BATCH_NUM = 3; tiling->SetALayout(A_BNUM, A_SNUM, 1, A_GNUM, A_DNUM); tiling->SetBLayout(B_BNUM, B_SNUM, 1, B_GNUM, B_DNUM); tiling->SetCLayout(C_BNUM, C_SNUM, 1, C_GNUM, C_DNUM); // 设置C矩阵排布 tiling->SetBatchNum(BATCH_NUM); tiling->SetBufferSpace(-1, -1, -1); optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData);
父主题: Matmul Tiling类