总体说明
面向用户提供一套极简易用的媒体处理和模型推理接口,用户可以更加灵活地定制自己的AI应用。主要向用户提供6个类,进行端到端推理的应用开发,分别为VideoDecoder、VideoEncoder、Image、ImageProcessor、Tensor以及Model。
- Image作为视频帧的抽象,可以通过VideoDecoder类将Image进行解码(如 .h264格式视频帧 -> .yuv格式视频帧),也可通过VideoEncoder类进行相反的过程。
- Image作为图像的抽象,可以通过ImageProcessor类中的Decode接口进行解码(如 .jpg格式图像 -> .yuv格式图像),也可通过ImageProcessor类中的Encode接口进行相反的过程。
此外,ImageProcessor类还提供了对于Image类的其他操作接口,如抠图,缩放等等。
Tensor类是一个数据类,面向Model类,作为其输入输出,Model是推理模型的抽象,负责申请模型推理所需要的资源,主要提供Infer接口进行推理。Image类包含一个ToTensor接口与Tensor类进行转换交互。
图1 总体示意图
父主题: API参考(C++) V2