总体说明

面向用户提供一套极简易用的媒体处理和模型推理接口，用户可以更加灵活地定制自己的AI应用。主要向用户提供6个类，进行端到端推理的应用开发，分别为VideoDecoder、VideoEncoder、Image、ImageProcessor、Tensor以及Model。

Image作为视频帧的抽象，可以通过VideoDecoder类将Image进行解码（如 .h264格式视频帧 -> .yuv格式视频帧），也可通过VideoEncoder类进行相反的过程。
Image作为图像的抽象，可以通过ImageProcessor类中的Decode接口进行解码（如 .jpg格式图像 -> .yuv格式图像），也可通过ImageProcessor类中的Encode接口进行相反的过程。

此外，ImageProcessor类还提供了对于Image类的其他操作接口，如抠图，缩放等等。

Tensor类是一个数据类，面向Model类，作为其输入输出，Model是推理模型的抽象，负责申请模型推理所需要的资源，主要提供Infer接口进行推理。Image类包含一个ToTensor接口与Tensor类进行转换交互。

图1 总体示意图

父主题： API参考（C++） V2