概述

Ascend C的算子实现主要包含两个部分:

本章内容先介绍矢量编程、矩阵编程、融合算子编程三种典型场景下的算子Tiling、Kernel实现,是对上文中三种典型编程范式的具体应用,同时也介绍了编程的更多细节、API的使用方法等。

然后分别介绍基于Kernel直调工程的算子开发和基于自定义算子工程的算子开发,主要内容涉及两种开发工程的对比,如何将算子Tiling、Kernel实现通过开发工程进行组织,特别的对于自定义算子工程还介绍了工程编译、算子包部署的额外流程,因为Kernel直调工程的编译相关内容和算子调用程序比较紧密,会在后续的Kernel直调章节一同介绍。