VENC视频编码
VENC(Video Encoder)将YUV420SP格式的图片编码成H.264/H.265格式的视频码流。关于VENC功能的详细介绍请参见VENC功能及约束说明。
本节介绍VENC视频编码的接口调用流程,同时配合示例代码辅助理解该接口调用流程。
Atlas 200/300/500 推理产品上,当前版本不支持该功能。
Atlas 训练系列产品上,当前版本不支持该功能。
Atlas A2训练系列产品/Atlas 800I A2推理产品上,不支持该功能。
接口调用流程
开发应用时,如果涉及视频编码,则应用程序中必须包含编码的代码逻辑,关于编码的接口调用流程,请先参见pyACL接口调用流程了解整体流程,再查看本节中的流程说明。
- 调用acl.himpi.sys_init接口进行媒体数据处理系统初始化。
- 调用acl.himpi.venc_create_chn函数创建完通道。
成功创建通道之后,您可以根据实际需求设置编码的高级参数,例如场景模式、码流控制器的高级参数等,请参见acl.himpi.venc_set_jpeg_param~acl.himpi.venc_compact_jpeg_tables章节中的接口说明。
- 调用acl.himpi.venc_get_fd将通道ID转换为一个文件句柄。
- 调用acl.himpi.sys_create_epoll函数创建DVPP epoll实例。
- 调用acl.himpi.sys_ctl_epoll函数将编码通道的文件句柄添加到epoll实例中,由epoll实例处理。
select或者poll方式,不需要执行该步骤。
- 调用acl.himpi.venc_start_chn函数通知通道准备开始编码。
- 调用acl.himpi.dvpp_malloc接口申请存放Device上输入数据的内存。
Atlas 200I/500 A2推理产品上,同时支持使用acl.rt.malloc接口申请内存。
对于Atlas 200I/500 A2推理产品,调用acl.himpi.dvpp_malloc接口申请的内存为媒体数据处理的专用内存,但专用内存的地址空间有限,若关注内存规划或内存资源有限时,建议调用acl.rt.malloc接口申请内存。
- 启动一个用户态线程,调用acl.himpi.sys_wait_epoll函数等待编码完成。
- 之后用户就可以调用acl.himpi.venc_send_frame函数发送待编码的码流。
- 一旦编码完成,acl.himpi.sys_wait_epoll函数或select函数或poll函数就会返回,用户就可以调用acl.himpi.venc_query_status接口查询编码状态,再调用acl.himpi.venc_get_stream函数获取编码结果。
- 用户需要注意的是,编码结果数据使用完成之后,需要及时调用acl.himpi.venc_release_stream函数释放Buffer。否则会因编码Buffer用完导致后续编码无法进行。
- 调用acl.himpi.dvpp_free接口释放输入内存。
Atlas 200I/500 A2推理产品上,若使用acl.rt.malloc接口申请内存,则需使用acl.rt.free接口释放内存。
- 当用户不需发送图像到目的通道继续编码时,需要调用acl.himpi.venc_stop_chn函数通知该通道不再接收新的输入图片。
- 调用acl.himpi.sys_ctl_epoll函数从epoll实例中删除编码通道的文件句柄。
- 当用户完成所有编码之后,需要调用acl.himpi.venc_destroy_chn释放编码通道以及内部内存资源。
- 调用acl.himpi.sys_close_epoll函数销毁DVPP epoll实例。
- 调用acl.himpi.sys_exit接口进行媒体数据处理系统去初始化。
优化视频编码质量
在实现VENC视频编码功能时,可在创建通道时设置基本参数、或调用对应的set接口设置高级参数,优化视频编码质量,以下调整手段可以叠加使用,效果是叠加的,例如:
- H.264视频数据获取场景,分辨率720P,gop = 60,帧率30fps,码率1M需要提升编码质量,可以使用如下优化手段组合:CBR模式、HI_VENC_SCENE_0、stats_time等于2、profile等于2、关闭宏块级码控。
- H.265电影场景,分辨率1080P,gop=30,帧率25fps,码率2M需要提升编码质量,可以使用如下优化手段组合:CBR模式、HI_VENC_SCENE_1、stats_time等于1、关闭宏块级码控。
当前支持以下方式优化视频编码质量:
- 设置基本参数,优化视频编码质量
不同分辨率的视频,其编码质量与视频的帧率、GOP(Group of pictures)、码率有关,在调用acl.himpi.venc_create_chn接口创建通道时,可设置编码的等级、设置H.264/H.265协议编码场景下CBR/VBR/AVBR/CVBR/QVBR模式的帧率、GOP、码率等参数,来调整视频编码质量:
- 编码等级,通过通过hi_venc_chn_attr["venc_attr"]字典内的“profile”属性来确定。
- 帧率,通过hi_venc_chn_attr["rc_attr"]字典内的“src_frame_rate”输入帧率参数、“dst_frame_rate”输出帧率属性来确定。
- GOP,通过hi_venc_chn_attr["rc_attr"]字典内的“gop”属性来确定。
- 码率,通过hi_venc_chn_attr["rc_attr"]字典内的“bit_rate”、“max_bit_rate”或“target_bit_rate”属性来确定。
表1 典型场景下帧率、GOP、码率的取值 画质/分辨率
帧率
GOP
码率(mbps)
4K
3840*2160/4096*2160
25或30
建议GOP为帧率的整数倍,例如帧率为25时,GOP建议25或50。
2K
2560*1440
25或30
建议GOP为帧率的整数倍,例如帧率为25时,GOP建议25或50。
1080P(蓝光)
1920*1080
25或30
建议GOP为帧率的整数倍,例如帧率为25时,GOP建议25或50。
720P(高清)
1280*720
25或30
建议GOP为帧率的整数倍,例如帧率为25时,GOP建议25或50。
480P/D1_N(标清)
854*480/720*480
25或30
建议GOP为帧率的整数倍,例如帧率为25时,GOP建议25或50。
576P/D1(标清)
720*576
25或30
建议GOP为帧率的整数倍,例如帧率为25时,GOP建议25或50。
270P(流畅)
480*270
25或30
建议GOP为帧率的整数倍,例如帧率为25时,GOP建议25或50。
CIF P/N
352*288/320*240
25或30
建议GOP为帧率的整数倍,例如帧率为25时,GOP建议25或50。
- 设置高级参数,调整视频编码细节
您可以调用接口设置码控模式、宏块级码率控制参数、编码场景模式等,来调整视频编码的细节,进一步改善编码质量。
表2 高级配置项列表 配置项
接口
参数名
说明
码控模式
追求码率平稳或追求PSNR大且码率符合目标值,配置为CBR。
追求节省码率,对主观编码质量有一定要求,配置为VBR。
追求节省码率,对主观编码质量有一定要求,且场景中有较多静止画面,配置为AVBR。
追求PSNR且对码率上浮没有严格要求,配置为QVBR。
追求节省码率,对主观编码质量有一定要求,且可以根据带宽、存储空间要求进行更多调整,配置为CVBR。
码率控制模型统计时间
关注长期码率稳定,短期波动不在意的可以设置大一些,例:DVR存盘。设大可以提高重编码判决的门槛,重编码次数会减少,但是码率波动会加大。
宏块级码率控制参数
hi_venc_rc_param字典内的“threshold_i”、“threshold_p”、“threshold_b”、“direction”、“row_qp_delta”属性。
如果图像内容复杂、细节较多或用户关注PSNR等客观指标时,需关闭宏块级码率控制。
第一帧的起始QP值
典型场景下,用户配置的码率小于表1中给的参考值,且编码后的视频第一帧明显模糊,则建议配置“first_frame_start_qp”属性,参数值取[min_i_qp, max_i_qp]的中间值,例如,[min_i_qp, max_i_qp]为[30, 40],则“first_frame_start_qp”配置为“35”,同时将“max_reencode_times”配置为“0”,会获得较好的编码质量。
编码场景模式
安防场景配置为HI_VENC_SCENE_0;自动驾驶、直播、游戏、动画、电影配置为HI_VENC_SCENE_1。
示例代码
调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝运行,仅供参考。
# 1.获取软件栈的运行模式,不同运行模式影响后续的接口调用流程(例如是否进行数据传输等)。 run_mode, ret = acl.rt.get_run_mode() # 2.pyACL 初始化。 ret = acl.init() # 3.运行管理资源申请。 # 4.初始化媒体数据处理系统。 ret = acl.himpi.sys_init() # 5.设置VENC模块参数。 param = {'mod_type':HI_VENC_MOD_H265} param, ret = acl.himpi.venc_get_mod_param(param) param['jpeg_mod_param']['one_stream_buf'] = 1 ret = acl.himpi.venc_set_mod_param(param) # 6.创建通道。 channel_id = 0 venc_attr = {'type': HI_VENC_MOD_H265, 'profile': 0, 'max_pic_width': 128, 'pic_width': 128, 'max_pic_height': 128, 'pic_height': 128, 'buf_size': 1024 * 1024 * 2, 'is_by_frame': 1} rc_attr = {'rc_mode':HI_VENC_RC_MODE_H265_VBR, 'h265_vbr':{'gop': 30, 'stats_time': 1, 'src_frame_rate': 30, 'dst_frame_rate': 30, 'max_bit_rate': 4000}} gop_attr = {'gop_mode':0, 'normal_p':{'ip_qp_delta':3}} attr = {'venc_attr':venc_attr, 'rc_attr':rc_attr, 'gop_attr':gop_attr} ret = acl.himpi.venc_create_chn(channel_id, attr) # 7.通知编码器开始接收输入数据。 recv_param = {'recv_pic_num':-1} ret = acl.himpi.venc_start_chn(channel_id, recv_param) # 8.发送输入数据。 # 8.1 申请输入内存。 input_size = 128 * 128 * 3 // 2 input_addr, ret = acl.himpi.dvpp_malloc(0, input_size); # 如果运行模式为ACL_HOST,则需要申请Host内存,将输入数据读入Host内存,再通过acl.rt.memcpy接口将Host的数据传输到Device,数据传输完成后,需及时释放Host内存;否则直接将输入数据读入Device内存。 # 直接将输入数据读入Device内存。 if run_mode == ACL_HOST: # 将输入图片读入内存中。 jpege_file = np.fromfile(jpege_filee_path, dtype=np.byte) jpege_file_size = jpege_file.itemsize * jpege_file.size bytes_data = jpege_file.tobytes() jpege_file_ptr = acl.util.bytes_to_ptr(bytes_data) # 数据传输。 ret = acl.rt.memcpy(input_addr, input_size, jpege_file_ptr, jpege_file_size, ACL_MEMCPY_HOST_TO_DEVICE) else: # 将输入图片读入内存中。 jpege_file = np.fromfile(jpege_file_path, dtype=np.byte) jpege_file = jpege_file.itemsize * jpege_file.size bytes_data = jpege_file.tobytes() jpege_file_ptr = acl.util.bytes_to_ptr(bytes_data) # 数据传输。 ret = acl.rt.memcpy(input_addr, input_size, jpege_file_ptr, jpege_file_size, ACL_MEMCPY_DEVICE_TO_DEVICE) # 8.2 发送输入数据,开始编码。 v_frame = {'width': 128, 'height': 128, 'field': HI_VIDEO_FIELD_FRAME, 'pixel_format': HI_PIXEL_FORMAT_YUV_SEMIPLANAR_420, 'video_format': HI_VIDEO_FORMAT_LINEAR, 'compress_mode': HI_COMPRESS_MODE_NONE, 'dynamic_range': HI_DYNAMIC_RANGE_SDR8, 'color_gamut': HI_COLOR_GAMUT_BT709, 'header_stride': [0, 0, 0], 'width_stride': [128, 0, 0], 'height_stride': [0, 0, 0], 'header_phys_addr': [0, 0, 0], 'phys_addr': [0, 0, 0], 'header_virt_addr': [0, 0, 0], 'virt_addr': [input_addr, 0, 0], 'time_ref': 0,'pts': cur_time} frame = {'v_frame':v_frame, 'pool_id':0, 'mod_id':HI_ID_VENC} ret = acl.himpi.venc_send_frame(channel_id, frame, 0) # 9.获取编码结果。 # 9.1 通过EPOLL处理编码完成事件。 fd = acl.himpi.venc_get_fd(channel_id) epoll_fd, ret = acl.himpi.sys_create_epoll(10) event['data'] = fd event['events'] = HI_DVPP_EPOLL_IN ret = acl.himpi.sys_ctl_epoll(epoll_fd, HI_DVPP_EPOLL_CTL_ADD, fd, event) # 编码完成前,会超时阻塞在这里,一旦完成,才会往下执行。 events, eventCount, ret = acl.himpi.sys_wait_epoll(epoll_fd, 3, 1000); # 9.2 获取编码结果。 status, ret = acl.himpi.venc_query_status(channel_id) stream = {'pack_cnt': status['cur_packs']} stream, ret = acl.himpi.venc_get_stream(self.channel_id, stream, 1000) # 9.3 如果运行模式为ACL_HOST,且Host上需要使用编码输出的码流,则需要申请Host内存,通过acl.rt.memcpy接口将Device的输出码流传输到Host。 # 9.3 获取编码输出码流数据。 if run_mode == ACL_HOST: # 申请Host内存。 output_buffer, ret= acl.rt.malloc_host(output_ize) # 数据传输。 ret = acl.rt.memcpy(output_buffer, output_ize, stream['pack'][0]['addr'], output_ize, ACL_MEMCPY_DEVICE_TO_HOST) # ...... # 数据使用完成后,及时释放不使用的内存。 ret = acl.rt.free_host(output_buffer) else: # 可以直接使用编码输出码流数据,在stream['pack'][0]['addr']指向的内存中。 # ...... # 10.释放输入内存和输出码流。 ret = acl.himpi.dvpp_free(input_addr) ret = acl.himpi.venc_release_stream(channel_id, stream) # 11.通知编码器停止接收输入数据。 ret = acl.himpi.venc_stop_chn(channel_id) ret = acl.himpi.sys_ctl_epoll(epoll_fd, HI_DVPP_EPOLL_CTL_DEL, fd, event) ret = acl.himpi.sys_close_epoll(epoll_fd) # 12.销毁通道。 ret = acl.himpi.venc_destroy_chn(channel_id) # 13. 媒体数据处理系统去初始化。 ret = acl.himpi.sys_exit() # 14. 释放运行管理资源。 # 15.pyACL去初始化。 ret = acl.finalize()