文档
注册

性能指标说明

本节仅描述各产品对应的昇腾AI处理器的性能指标参考数据,各产品由于其内存、CPU等配置不同,在性能规格上会存在差异,详细产品的性能规格请查阅昇腾社区的官方说明。

本节以单个昇腾AI处理器为例,描述基本场景性能指标参考,如下表所示,其它分辨率可以等量估算。

性能指标说明(Atlas 200/300/500 推理产品

以下性能数据,是基于一个stream上下发10个异步媒体数据处理任务后,执行一次aclrtSynchronizeStream接口。

  • 对于非8K图像,单个Device的基本场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):

    对于1080p的图像,若存在Host->Device的图片数据拷贝,由于拷贝带宽限制,最大总帧率约为1000fps。

    对于4K的图像,若存在Host->Device的图片数据拷贝,由于拷贝带宽限制,最大总帧率约为250fps。
    表1 Atlas 200/300/500 推理产品的昇腾AI处理器性能指标参考数据

    场景举例

    总帧率

    • 输入图像分辨率:1080p(1920*1080)
    • 输出图像分辨率:1080p(1920*1080)
    • 输入/输出图片格式:YUV420SP
    • n路(n<4)

    n*360fps

    • 输入图像分辨率:1080p(1920*1080)
    • 输出图像分辨率:1080p(1920*1080)
    • 输入/输出图片格式:YUV420SP
    • n路(n≥4)

    1440fps

    • 输入图像分辨率:4K图像(3840*2160)
    • 输出图像分辨率:4K图像(3840*2160)
    • 输入/输出图片格式:YUV420SP
    • n路(n<4)

    n*90fps

    • 输入图像分辨率:4K图像(3840*2160)
    • 输出图像分辨率:4K图像(3840*2160)
    • 输入/输出图片格式:YUV420SP
    • n路(n≥4)

    360fps

  • 对于8K图像,单个Device的典型场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
    表2 Atlas 200/300/500 推理产品的昇腾AI处理器性能指标参考数据

    场景举例

    总帧率

    • 输入图像分辨率:8K图像(7680*4320)
    • 输出图像分辨率:1080p(1920*1080)
    • 输入/输出图片格式:YUV420SP
    • n路(n<4)

    n*25fps

    • 输入图像分辨率:8K图像(7680*4320)
    • 输出图像分辨率:1080p(1920*1080)
    • 输入/输出图片格式:YUV420SP
    • n路(n≥4)

    100fps

    • 输入图像分辨率:8K图像(7680*4320)
    • 输出图像分辨率:4K图像(3840*2160)
    • 输入/输出图片格式:YUV420SP
    • n路(n<4)

    n*25fps

    • 输入图像分辨率:8K图像(7680*4320)
    • 输出图像分辨率:4K图像(3840*2160)
    • 输入/输出图片格式:YUV420SP
    • n路(n≥4)

    100fps

    • VPC处理性能与处理过程中的图像分辨率强相关,以输入图像和输出图像中的最大分辨率作为基准分辨率,基准分辨率越大,处理耗时越久,性能越低。
    • 调用VPC批处理接口(接口命名中包含Batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。

性能指标说明(Atlas 推理系列产品(Ascend 310P处理器)

以下性能数据,是基于一个stream上下发64个异步媒体数据处理任务后,执行一次aclrtSynchronizeStream接口,且Host服务器配置为:CPU主频为Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz,CPU核心数为14。

单个Device的基本场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
表3 Atlas 推理系列产品(Ascend 310P处理器)的昇腾AI处理器性能指标参考数据

场景举例

总帧率

  • 输入图片分辨率:1080p(1920*1080)
  • 输出图片分辨率:1080p(1920*1080)
  • 输入/输出图片格式:YUV420SP
  • n路(1≤n≤12)

n*360fps

  • 输入图片分辨率:1080p(1920*1080)
  • 输出图片分辨率:1080p(1920*1080)
  • 输入/输出图片格式:YUV420SP
  • n路(n>12)

4320fps

  • 输入图片分辨率:4K图像(3840*2160)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(1≤n≤12)

n*90fps

  • 输入图片分辨率:4K图像(3840*2160)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(n>12)

1080fps

  • 输入图片分辨率:8K图像(7680*4320)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(1≤n≤12)

n*22.5fps

  • 输入图片分辨率:8K图像(7680*4320)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(n>12)

270fps

调用VPC批处理接口(接口命名中包含Batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。

性能指标说明(Atlas 训练系列产品

以下性能数据,是基于一个stream上下发10个异步媒体数据处理任务后,执行一次aclrtSynchronizeStream接口。

  • 对于非8K图像,单个Device的基本场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
    表4 Atlas 训练系列产品的昇腾AI处理器性能指标参考数据

    场景举例

    总帧率

    • 输入图像分辨率:1080p(1920*1080)
    • 输出图像分辨率:1080p(1920*1080)
    • 输入/输出图片格式:YUV420SP
    • n路(n<16)

    n*360fps

    • 输入图像分辨率:1080p(1920*1080)
    • 输出图像分辨率:1080p(1920*1080)
    • 输入/输出图片格式:YUV420SP
    • n路(n≥16)

    5760fps

    • 输入图像分辨率:4K图像(3840*2160)
    • 输出图像分辨率:4K图像(3840*2160)
    • 输入/输出图片格式:YUV420SP
    • n路(n<16)

    n*90fps

    • 输入图像分辨率:4K图像(3840*2160)
    • 输出图像分辨率:4K图像(3840*2160)
    • 输入/输出图片格式:YUV420SP
    • n路(n≥16)

    1440fps

  • 对于8K图像,单个Device的典型场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
    表5 Atlas 训练系列产品的昇腾AI处理器性能指标参考数据

    场景举例

    总帧率

    • 输入图像分辨率:8K图像(7680*4320)
    • 输出图像分辨率:1080p(1920*1080)
    • 输入/输出图片格式:YUV420SP
    • n路(n<16)

    n*25fps

    • 输入图像分辨率:8K图像(7680*4320)
    • 输出图像分辨率:1080p(1920*1080)
    • 输入/输出图片格式:YUV420SP
    • n路(n≥16)

    400fps

    • 输入图像分辨率:8K图像(7680*4320)
    • 输出图像分辨率:4K图像(3840*2160)
    • 输入/输出图片格式:YUV420SP
    • n路(n<16)

    n*25fps

    • 输入图像分辨率:8K图像(7680*4320)
    • 输出图像分辨率:4K图像(3840*2160)
    • 输入/输出图片格式:YUV420SP
    • n路(n≥16)

    400fps

    调用VPC批处理接口(接口命名中包含Batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。

性能指标说明(Atlas 200/500 A2推理产品

单个Device场景下的性能指标参考如下(1路对应一个通道,一个通道对应一个线程,或者n路对应一个通道,一个通道对应n个线程):

表6 Atlas 200/500 A2推理产品的昇腾AI处理器性能指标参考数据

场景举例

总帧率

  • 输入图片分辨率:1080p(1920*1080)
  • 输出图片分辨率:1080p(1920*1080)
  • 输入/输出图片格式:YUV420SP
  • n路(n<2)

n*800fps

  • 输入图片分辨率:1080p(1920*1080)
  • 输出图片分辨率:1080p(1920*1080)
  • 输入/输出图片格式:YUV420SP
  • n路(n≥2)

1600fps

  • 输入图片分辨率:4K图像(3840*2160)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(n<2)

n*200fps

  • 输入图片分辨率:4K图像(3840*2160)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(n≥2)

400fps

  • 输入图片分辨率:8K图像(7680*4320)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(n<2)

n*100fps

  • 输入图片分辨率:8K图像(7680*4320)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(n≥2)

200fps

调用VPC批处理接口(接口命名中包含batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。

性能指标说明(Atlas A2训练系列产品/Atlas 800I A2推理产品

表7 Atlas A2训练系列产品/Atlas 800I A2推理产品的昇腾AI处理器性能指标参考数据

场景举例

总帧率

  • 输入图片分辨率:1080p(1920*1080)
  • 输出图片分辨率:1080p(1920*1080)
  • 输入/输出图片格式:YUV420SP
  • n路(1≤n≤10)

n*1440fps

  • 输入图片分辨率:1080p(1920*1080)
  • 输出图片分辨率:1080p(1920*1080)
  • 输入/输出图片格式:YUV420SP
  • n路(n>10)

14400fps

  • 输入图片分辨率:4K图像(3840*2160)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(1≤n≤10)

n*360fps

  • 输入图片分辨率:4K图像(3840*2160)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(n>10)

3600fps

  • 输入图片分辨率:8K图像(7680*4320)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(1≤n≤10)

n*90fps

  • 输入图片分辨率:8K图像(7680*4320)
  • 输出图片分辨率:4K图像(3840*2160)
  • 输入/输出图片格式:YUV420SP
  • n路(n>10)

900fps

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词