下载
中文
注册

DataCachePreload

功能说明

从源地址所在的特定GM地址预加载数据到data cache中。

函数原型

1
2
template <typename T>
__aicore__ inline void DataCachePreload(const GlobalTensor<uint64_t> &srcTensor, const T cacheOffset)

参数说明

表1 参数说明

参数名

输入/输出

描述

srcTensor

输入

源操作数,类型为GlobalTensor。支持的数据类型为:uint64_t。

cacheOffset

输入

在源操作数上偏移cacheOffset大小开始加载数据,单位为byte,支持的数据类型为:int16_t/int64_t。

返回值

支持的型号

Atlas A2 训练系列产品/Atlas 800I A2 推理产品

Atlas 推理系列产品AI Core

Atlas 200I/500 A2 推理产品

约束说明

频繁调用此接口可能导致保留站拥塞,这种情况下,此指令将被视为NOP指令,阻塞Scalar流水。因此不建议频繁调用该接口。

调用示例

1
2
3
AscendC::GlobalTensor<uint64_t> srcGlobal;
int64_t cacheOffset = 0;
AscendC::DataCachePreload(srcGlobal, cacheOffset);