文档
注册
评分
提单
论坛
小AI

单算子API执行

  • 除本章中单算子API执行方式调用单算子,AscendCL还提供了基于单算子模型执行方式的单算子调用方式,详细请参见单算子调用方式:单算子模型执行、单算子API执行
  • 对于接口文档中未审明支持的场景(如产品型号、数据类型、数据格式等),不推荐用户使用,当前版本暂不保证其调用效果。

本章主要介绍如表1所示的算子API,提供了详细的接口介绍,包括接口原型、功能描述、参数说明、调用示例等,指导用户快速上手调用算子API。

算子接口的调用流程请参见单算子API执行接口调用流程,其调用示例(以NN算子调用为例)请参见调用NN算子接口示例代码

表1 单算子API执行接口列表

接口分类

说明

接口获取

产品支持度

NN算子

Neural Network算子,覆盖TensorFlow、Pytorch、MindSpore、ONNX等常见框架的深度学习算法计算类型,包括Softmax、MatMul、Convolution等典型计算,接口前缀为aclnnXxx

参考算子加速库接口参考中“NN算子接口”章节。

Atlas 200/300/500 推理产品不支持该接口。

融合算子

提供了Flash Attention、MC2等高性能融合算子,通过将多个独立“小算子”(如向量Vector、矩阵Cube)融合成一个“大算子”,达到提升算子性能的目的,接口前缀为aclnnXxx

说明:
  • 当前融合算子不支持使用昇腾虚拟化实例。
  • 当前部分融合算子已开源,可单击Link获取开源算子信息。

参考算子加速库接口参考中“融合算子接口”章节。

Atlas 200/300/500 推理产品不支持该接口。

Atlas 200/500 A2推理产品不支持该接口。

Atlas 训练系列产品不支持该接口。

DVPP算子

Digital Vision Pre-Processing算子,主要实现图像缩放、JPEG图像解码、图像归一化等功能,接口前缀为acldvppXxx。

参考算子加速库接口参考中“DVPP算子接口”章节。

Atlas 200/300/500 推理产品不支持该接口。

Atlas 200/500 A2推理产品不支持该接口。

Atlas 训练系列产品不支持该接口。

Atlas 推理系列产品(Ascend 310P处理器)不支持该接口。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词