下载
中文
注册

SetBlockDim

函数功能

设置block dim,即参与计算的VectorCore或者CubeCore核数。

函数原型

ge::graphStatus SetBlockDim(const uint32_t block_dim)

参数说明

参数

输入/输出

说明

block_dim

输入

BlockDim是逻辑核的概念,取值范围为[1,65535]。为了充分利用硬件资源,一般设置为物理核的核数或其倍数。对于耦合架构和分离架构,BlockDim在运行时的意义和设置规则有一些区别,具体说明如下:

  • 耦合架构:由于其Vector、Cube单元是集成在一起的,BlockDim用于设置启动多个AICore核实例执行,不区分Vector、Cube。AI Core的核数可以通过GetCoreNumAiv或者GetCoreNumAic获取。
  • 分离架构
    • 针对仅包含Vector计算的算子,BlockDim用于设置启动多少个Vector(AIV)实例执行,比如某款AI处理器上有40个Vector核,建议设置为40。
    • 针对仅包含Cube计算的算子,BlockDim用于设置启动多少个Cube(AIC)实例执行,比如某款AI处理器上有20个Cube核,建议设置为20。
    • 针对Vector/Cube融合计算的算子,启动时,按照AIV和AIC组合启动,BlockDim用于设置启动多少个组合执行,比如某款AI处理器上有40个Vector和+20个Cube核,一个组合是2个Vector和1个Cube核,建议设置为20,此时会启动20个组合,即40个Vector和+20个Cube核。注意:该场景下,设置的BlockDim逻辑核的核数不能超过物理核(2个Vector和1个Cube核组合为1个物理核)的核数。
    • AIC/AIV的核数分别通过GetCoreNumAicGetCoreNumAiv接口获取。

返回值说明

设置成功时返回“ge::GRAPH_SUCCESS”。

关于graphStatus的定义,请参见ge::graphStatus

约束说明

调用示例

ge::graphStatus Tiling4XXX(TilingContext* context) {
  auto ret = context->SetBlockDim(32);
  // ...
}