各功能的介绍如下表所示,昇腾AI处理器对这些功能的支持度请参见功能支持度说明(AIPP当前各版本均支持)。
功能 |
子功能模块 |
描述 |
---|---|---|
获取视频数据 |
ISP(Image Signal Processing)系统控制 |
系统控制部分用于注册3A算法、注册Sensor驱动、初始化ISP firmware、运行ISP firmware、退出ISP firmware、配置ISP属性等功能。 |
MIPI Rx ioctl命令字 |
MIPI Rx是一个支持多种差分视频输入接口的采集单元,通过combo-PHY接收MIPI/LVDS/sub-LVDS/HiSPi接口的数据,通过不同的功能模式配置,MIPI Rx可以支持多种速度和分辨率的数据传输需求,支持多种外部输入设备。 |
|
VI(Vedio Input) |
VI模块捕获视频图像,可对其做裁剪、防抖、颜色优化、亮度优化、噪声去除等处理,并输出YUV或RAW格式的图像数据。 |
|
展示视频数据 |
VO(Vedio Output) |
VO模块接收VPSS处理后的输出图像,可进行播放控制等处理,最后按用户配置的输出协议(当前仅支持HDMI)输出给外围视频设备。 VO可配合TDE(Two Dimensional Engine)模块、HIFB(Hisilicon Framebuffer)模块,利用硬件分别进行图形绘制、叠加图形层管理。 |
HDMI(High Definition Multimedia Interfac) |
HDMI是全数字化影像和声音发送接口,可以发送未压缩的音频及视频信号。 |
|
TDE(Two Dimensional Engine) |
TDE是图形二维加速引擎,它利用硬件为 OSD(On Screen Display)和 GUI(Graphics User Interface)提供快速的图形绘制功能,主要有快速拷贝、快速色彩填充、模式填充(当前仅支持Alpha Blending操作)。 |
|
HIFB(Hisilicon Framebuffer) |
HIFB用于管理叠加图形层,它不仅提供Linux Framebuffer的基本功能,还在Linux Framebuffer的基础上增加图层显示起始位置修改、层间Alpha等扩展功能。 |
|
区域管理 |
Region |
叠加在视频上的OSD (On Screen Display)和遮挡在视频上的色块统称为区域。区域管理模块,用于统一管理这些区域资源,用于在视频上显示一些特定信息(如通道号、时间戳等)、或在视频中填充色块用于遮挡,当前该功能需配合VPSS一起使用。 |
图像/视频数据处理 |
VPSS(Video Process Sub-System) |
VPSS模块支持对输入图像进行统一预处理,如去噪、去隔行、裁剪等,然后再对各通道分别进行处理,如缩放、加边框等。 |
AIPP(Artificial Intelligence Pre-Processing) |
AIPP人工智能预处理,在AI Core上完成数据预处理,主要功能包括改变图像尺寸(抠图、填充等)、色域转换(转换图像格式)、减均值/乘系数(改变图像像素)等。
AIPP区分为静态AIPP和动态AIPP。您只能选择静态AIPP或动态AIPP中的一种来处理图片,不能同时配置静态AIPP和动态AIPP两种方式。
|
|
DVPP(Digital Vision Pre-Processing) |
DVPP是昇腾AI处理器内置的图像处理单元,通过AscendCL媒体数据处理接口提供强大的媒体处理硬加速能力,主要功能包括以下功能:
说明:
AIPP、DVPP可以分开独立使用,也可以组合使用。组合使用场景下,一般先使用DVPP对图片/视频进行解码、抠图、缩放等基本处理,但由于DVPP硬件上的约束,DVPP处理后的图片格式、分辨率有可能不满足模型的要求,因此还需要再经过AIPP进一步做色域转换、抠图、填充等处理。 例如,在Atlas 200/300/500 推理产品上,由于DVPP视频解码仅支持输出YUV格式的图片,如果模型需要RGB格式的图片,则需要再经过AIPP做色域转换的处理。 |
|
音频数据获取和输出 |
AI(Audio Input) |
AI模块捕获音频数据 。 |
AO(Audio Output) |
通过ADEC模块解码后的音频数据,AO模块支持播放音频。 |
|
音频数据编解码 |
AENC(Audio Encoder) |
通过AI模块获取的音频数据,AENC模块支持对其进行编码,输出音频码流。 |
ADEC(Audio Decoder) |
ADEC支持解码G.711a协议的音频码流,再通过AO模块播放音频。 |
昇腾AI处理器对媒体数据处理V2版本各功能的支持度如下表所示。
昇腾AI处理器 |
VPC |
JPEGD |
JPEGE |
PNGD |
VDEC |
VENC |
---|---|---|---|---|---|---|
Atlas 推理系列产品 |
√ |
√ |
√ |
√ |
√ |
√ |
Atlas A2训练系列产品 |
√ |
√ |
√ |
√ |
√ |
x |
使用本章中介绍的接口,有以下注意点:
针对Atlas 推理系列产品和Atlas A2训练系列产品:媒体数据处理功能在每个进程内,可访问的地址空间最大为16GB。
实现媒体数据处理的各功能前,必须调用接口创建对应功能的通道,请分别参见VPC图像处理功能、VDEC视频解码功能/JPEGD图片解码功能、VENC视频编码功能/JPEGE图片编码功能、PNGD图片解码功能章节下的通道创建与销毁接口,查看接口说明以及通道数的最大限制。
通道的创建与销毁会涉及资源的申请与释放,反复创建与销毁通道会影响业务性能,因此建议根据实际场景管理通道,例如,如果有持续VPC图片处理,则创建VPC的通道后,等到所有VPC功能调用完成后,再销毁该VPC通道。
通道数量多,会影响Device的CPU占用率和内存占用,通道数量建议参考各功能章节下的性能指标的路数。