性能指标说明
本节仅描述各产品对应的昇腾AI处理器的性能指标参考数据,各产品由于其内存、CPU等配置不同,在性能规格上会存在差异,详细产品的性能规格请查阅昇腾社区的官方说明。
本节以单个昇腾AI处理器为例,描述基本场景性能指标参考,如下表所示,其它分辨率可以等量估算。
性能指标说明(Atlas 200/300/500 推理产品)
以下性能数据,是基于一个stream上下发10个异步媒体数据处理任务后,执行一次aclrtSynchronizeStream接口。
- 对于非8K图像,单个Device的基本场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
对于1080p的图像,若存在Host->Device的图片数据拷贝,由于拷贝带宽限制,最大总帧率约为1000fps。
对于4K的图像,若存在Host->Device的图片数据拷贝,由于拷贝带宽限制,最大总帧率约为250fps。表1 Atlas 200/300/500 推理产品的昇腾AI处理器性能指标参考数据 场景举例
总帧率
- 输入图像分辨率:1080p(1920*1080)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n<4)
n*360fps
- 输入图像分辨率:1080p(1920*1080)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n≥4)
1440fps
- 输入图像分辨率:4K图像(3840*2160)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n<4)
n*90fps
- 输入图像分辨率:4K图像(3840*2160)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n≥4)
360fps
- 对于8K图像,单个Device的典型场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
表2 Atlas 200/300/500 推理产品的昇腾AI处理器性能指标参考数据 场景举例
总帧率
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n<4)
n*25fps
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n≥4)
100fps
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n<4)
n*25fps
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n≥4)
100fps
- VPC处理性能与处理过程中的图像分辨率强相关,以输入图像和输出图像中的最大分辨率作为基准分辨率,基准分辨率越大,处理耗时越久,性能越低。
- 调用VPC批处理接口(接口命名中包含Batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。
性能指标说明(Atlas 推理系列产品)
以下性能数据,是基于一个stream上下发64个异步媒体数据处理任务后,执行一次aclrtSynchronizeStream接口,且Host服务器配置为:CPU主频为Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz,CPU核心数为14。
场景举例 |
总帧率 |
---|---|
|
n*360fps |
|
4320fps |
|
n*90fps |
|
1080fps |
|
n*22.5fps |
|
270fps |

调用VPC批处理接口(接口命名中包含Batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。
性能指标说明(Atlas 训练系列产品)
以下性能数据,是基于一个stream上下发10个异步媒体数据处理任务后,执行一次aclrtSynchronizeStream接口。
- 对于非8K图像,单个Device的基本场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
表4 Atlas 训练系列产品的昇腾AI处理器性能指标参考数据 场景举例
总帧率
- 输入图像分辨率:1080p(1920*1080)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n<16)
n*360fps
- 输入图像分辨率:1080p(1920*1080)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n≥16)
5760fps
- 输入图像分辨率:4K图像(3840*2160)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n<16)
n*90fps
- 输入图像分辨率:4K图像(3840*2160)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n≥16)
1440fps
- 对于8K图像,单个Device的典型场景性能指标参考如下(1路对应一个通道,一个通道对应一个线程):
表5 Atlas 训练系列产品的昇腾AI处理器性能指标参考数据 场景举例
总帧率
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n<16)
n*25fps
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:1080p(1920*1080)
- 输入/输出图片格式:YUV420SP
- n路(n≥16)
400fps
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n<16)
n*25fps
- 输入图像分辨率:8K图像(7680*4320)
- 输出图像分辨率:4K图像(3840*2160)
- 输入/输出图片格式:YUV420SP
- n路(n≥16)
400fps
调用VPC批处理接口(接口命名中包含Batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。
性能指标说明(Atlas 200/500 A2推理产品)
单个Device场景下的性能指标参考如下(1路对应一个通道,一个通道对应一个线程,或者n路对应一个通道,一个通道对应n个线程):
场景举例 |
总帧率 |
---|---|
|
n*800fps |
|
1600fps |
|
n*200fps |
|
400fps |
|
n*100fps |
|
200fps |

调用VPC批处理接口(接口命名中包含batch,例如acldvppVpcBatchCropAsync接口)时,由于图像处理单元DVPP(Digital Video Pre-Processing)内部多个VPC硬件单元会并行处理图片任务,因此单路就可以达到最大总帧率。
性能指标说明(Atlas A2训练系列产品/Atlas 800I A2推理产品)
场景举例 |
总帧率 |
---|---|
|
n*1440fps |
|
14400fps |
|
n*360fps |
|
3600fps |
|
n*90fps |
|
900fps |