下载
中文
注册
通用目标检测识别解决方案

概述

该解决方案使用了YoloV3图片检测模型与CNN颜色分类模型,基于CANN AI应用编程接口,对数据预处理、模型推理、模型后处理等AI核心计算逻辑进行模块化组装,实现了车辆检测和车身颜色识别的基础功能,流程如下所示。

同时,该样例开放出多个编程定制点,并公开了系统的定制文档,详细介绍了样例代码结构、编译运行方法,以及如何基于现有样例代码进行功能定制和扩展,让不同程度的AI开发者们轻松上手。

定制开发

该解决方案覆盖如下定制场景:

1、持多格式输入和输出

CANN通用目标检测和识别样解决方案支持图片、离线视频、RTSP视频流等多输入格式,开发者可基于此样例实现对图片和视频等不同格式的目标进行检测识别。另外在结果展示方面,该样例支持图片、离线视频、Web前端等多形式展现,可根据业务场景灵活呈现识别结果。

2、支持轻松替换和串接模型

开发者可基于该解决方案实现模型的替换、增加与删减,实现更多AI功能。开发者需要根据模型以及样例功能的要求,进行模型推理、预处理与后处理代码的定制修改。

3、支持高效数据预处理

图片、视频等各类数据是进行目标检测和识别的原料,在把数据投入AI算法或模型前,我们需要对数据进行预加工,才能达到更加高效和准确的计算。该解决方案采用独立数据预处理模块,支持开发者按需定制,高效实现解码、抠图、缩放、色域转换等各种常见数据处理功能。

4、支持图片数、分辨率可变场景定制

在计算机视觉领域,开发者们除了需要应对输入数据格式等方面差异,还会经常遇到图片数量、分辨率不确定的场景。比如,由于检测出的目标个数不固定,导致程序要等到图片攒到固定数量再进行计算,浪费了大量宝贵的计算资源。该解决方案开放了便捷的定制入口,支持设置多种数据量Batch档位、多种分辨率档位,在推理时根据实际输入情况灵活匹配,不仅扩宽了业务场景,更有效节省计算资源,大大提升AI计算效率。

5、支持多路多线程高性能编程

为了满足开发者实现高性能AI应用,该解决方案支持通过极为友好和便捷的方式调整线程数和设备路数,提升设备资源利用率。

6、高效后处理计算

该解决方案开放了后处理使用算子的方式进行实现的功能,将原本需要在CPU上进行处理的功能推送到昇腾AI处理器上执行,利用昇腾AI处理器强大的算力实现后处理的加速,进一步提升整个AI应用的计算效率。