下载
中文
注册

总体说明

多版本接口差异

  • 本手册中媒体数据处理V1版本与媒体数据处理V2版本的接口功能范围相同,都是描述处理媒体数据的接口,用于实现抠图、图片缩放、格式转换等功能,但两套接口不能混用。
    • 建议使用V2版本中的接口,保证后续版本接口功能以及业务的连续演进。
    • V1版本中的接口是为了兼容旧版本,保证使用该部分接口的用户能继续使用,后续版本不再演进。

功能说明

本章节介绍媒体数据处理V1版本(DVPP,Digital Vision Pre-Processing)的功能,如表1所示。

表1 功能说明

功能

说明

VPC(Vision Preprocessing Core)

负责图像处理功能,支持对图片做抠图、缩放、格式转换等操作,详细描述请参见功能说明

JPEGD(JPEG Decoder)

负责完成图像解码功能,将.jpg、.jpeg、.JPG、.JPEG图片解码成YUV格式图片,详细描述请参见功能及约束说明

JPEGE(JPEG Encoder)

负责完成图像编码功能,将YUV格式图片编码成.jpg图片,详细描述请参见功能及约束说明

VDEC(Video Decoder)

负责视频解码,详细描述请参见功能及约束说明

VENC(Video Encoder)

负责视频编码,详细描述请参见功能及约束说明

PNGD(PNG Decoder)

负责PNG格式图片的解码,详细描述请参见功能及约束说明

功能支持度说明

各产品对媒体数据处理V1版本各功能的支持度如表2所示。

各标识的含义如下:
  • √:支持。
  • x:不支持。
表2 功能支持度说明

产品

VPC

JPEGD

JPEGE

PNGD

VDEC

VENC

Atlas 200/300/500 推理产品

Atlas 200I/500 A2推理产品

Atlas 训练系列产品

x

Atlas A2训练系列产品/Atlas 800I A2推理产品

x

Atlas 推理系列产品

整体约束说明

使用本章中介绍的接口,有以下注意点:

  • 关于异步接口:

    对于本章介绍的异步接口,调用接口成功仅表示任务下发成功,不表示任务执行成功,对于有依赖的接口,为确保能按序执行任务,建议用户在多个接口中指定同一个Stream,因为同一个Stream中的任务按接口调用顺序执行。

    在调用异步口对图片进行解码、抠图、缩放等操作时,如果任务之间有依赖,一定要调用acl.rt.synchronize_stream接口确保在同一个Stream中的任务按序执行。

    从性能角度考虑,建议一个Stream上下发多个异步媒体数据处理任务后,执行一次acl.rt.synchronize_stream接口。

    调用异步接口后,不能马上释放资源,需调用同步等待接口(例如,acl.rt.synchronize_stream)确保Device侧任务执行完成后才能释放。

  • 关于内存申请/释放:

    1. 实现媒体数据处理的VPC、JPEGD、JPEGE等功能前,若需要申请Device上的内存存放输入或输出数据,需调用acl.media.dvpp_malloc申请内存、调用acl.media.dvpp_free接口释放内存。
    2. 调用1申请出来的内存可以满足媒体数据处理的要求,也可以在其它任务中使用,例如,从性能角度,为了减少拷贝,媒体数据处理的输出作为模型推理的输入,实现内存复用。
    3. 由于媒体数据处理访问的地址空间有限,为确保媒体数据处理时内存足够,除媒体数据处理功能外的其它功能(例如,模型加载),建议调用内存管理章节下的acl.rt.malloc接口、acl.rt.malloc_host接口或acl.rt.malloc_cached接口申请内存。

      Atlas 推理系列产品上,媒体数据处理功能在每个进程内,可访问的地址空间最大为16GB。

      Atlas A2训练系列产品/Atlas 800I A2推理产品上,媒体数据处理功能在每个进程内,可访问的地址空间最大为16GB。

  • 关于通道的要求:

    实现媒体数据处理的各功能前,必须调用接口创建对应功能的通道,创建通道的接口请参见通道创建与释放。通道的创建与销毁会涉及资源的申请与释放,反复创建与销毁通道会影响业务性能,因此建议根据实际场景管理通道,例如,如果有持续VPC图片处理,则创建VPC的通道后,等到所有VPC功能调用完成后,再销毁该VPC通道。

    通道数量多,会影响Device的CPU占用率和内存占用,通道数量建议参考各功能章节下的的性能指标的路数。

    Atlas 推理系列产品,各功能的通道数有一定的限制,VPC的通道数最多256,JPEGD与VDEC共用通道且通道数最多256,JPEGE与VENC共用通道且通道数最多256,PNGD的通道数最多128。创建通道的接口请参见通道创建与释放

    Atlas A2训练系列产品/Atlas 800I A2推理产品,各功能的通道数有一定的限制,VPC的通道数最多256,JPEGD的通道数最多256,VDEC的通道数最多128,JPEGE的通道数最多256,PNGD的通道数最多128。创建通道的接口请参见通道创建与释放

    Atlas 200I/500 A2推理产品,各功能的通道数有一定的限制,VPC的通道数最多128,JPEGD的通道数最多128,VDEC的通道数最多128,JPEGE的通道数最多128,VENC的通道数最多128,PNGD的通道数最多128。创建通道的接口请参见通道创建与释放

对于Atlas 推理系列产品昇腾虚拟化实例(Ascend Virtual Instance)场景下,如果通道总数不为整数,则向下取整:

  • VPC通道总数 = ( 被分配的VPC硬件单元数量 / VPC硬件单元总数 ) * 256
  • VDEC通道和JPEGD通道总数 = ( 被分配的VDEC硬件单元+JPEGD硬件单元数量之和 / VDEC硬件单元+JPEGD硬件单元总数之和 ) * 256
  • VENC通道和JPEGE通道总数 = ( 被分配的VENC硬件单元+JPEGE硬件单元数量之和 / VENC硬件单元+JPEGE硬件单元总数之和 ) * 256
  • PNGD通道总数 = 切分规格 * 128

    对于PNGD功能,若使用以下昇腾虚拟化实例(Ascend Virtual Instance)模板,则对通道数的限制不同:

    • 使用vir04_4c_dvpp模板时,通道总数固定为128。
    • 使用vir04_3c_ndvpp模板时,表示不使用DVPP功能,因此通道总数为0。

对于Atlas A2训练系列产品/Atlas 800I A2推理产品昇腾虚拟化实例(Ascend Virtual Instance)场景下,如果通道总数不为整数,则向下取整:

  • VPC通道总数最多256。
  • VDEC通道 = ( 被分配的VDEC硬件单元 / VDEC硬件单元 ) * 32,如果通道总数不为整数,则向下取整。JPEGD的通道数不受算力影响,但JPEGD+VDEC的总通道数最大256。
  • JPEGE通道总数最多256。
  • PNGD通道总数 = 切分规格 * 128
    对于PNGD功能,若使用以下昇腾虚拟化实例(Ascend Virtual Instance)模板,则对通道数的限制不同:
    • 使用vir12_3c_32g_m、vir10_3c_16g_m、vir10_3c_32g_m模板时,通道总数固定为128。
    • 使用vir12_3c_32g_nm、vir10_3c_16g_nm、vir10_3c_32g_nm模板时,表示不使用DVPP功能,因此通道总数为0。

对于Atlas 200I/500 A2推理产品昇腾虚拟化实例(Ascend Virtual Instance)场景下,如果通道总数不为整数,则向下取整:

  • VPC通道总数最多128。
  • VDEC通道 = ( 被分配的VDEC硬件单元 / VDEC硬件单元 ) * 128,如果通道总数不为整数,则向下取整。JPEGD的通道数不随算力影响,但JPEGD+VDEC的总通道数最大128。
  • VENC通道 = ( 被分配的VENC硬件单元 / VENC硬件单元 ) * 128,如果通道总数不为整数,则向下取整。JPEGE的通道数不随算力影响,但JPEGE+VENC的总通道数最大128。

昇腾虚拟化实例(Ascend Virtual Instance)的详细描述,以及各场景下的算力资源规格请参见《昇腾虚拟化实例(AVI)用户指南》