简介
产品背景
计算机视觉(Computer Vision,以下简称“CV”)发展历程是一个不断探索和发展的过程。CV最初是为了实现计算机对数字图片的简单处理而产生的,研究内容主要包括图像处理、模式识别、机器学习、深度学习等方面。在智能视频分析(Intelligent Video Analytics,以下简称“IVA”)行业中,传统计算常见算法的应用领域有很多,例如目标识别、视频结构化、动作行为识别等。
随着硬件技术和算法的不断进步,视频与图像已逐渐成为全球互联网流量的主要组成部分。随着媒体服务的快速增长,AI图像算法基础的视频图像处理,逐渐成为计算流程中的成本壁垒和性能瓶颈。在此背景上,Vision SDK致力于视频图像处理算法加速,提升视频图像处理性能,降低CV应用的开发复杂度,加速CV应用开发部署。
产品定义
Vision SDK是MindSDK中面向图片和视频视觉分析的SDK,提供了基本的视频、图像智能分析能力及编程框架。
- 通过API接口方式开发:提供原生的推理API以及算子加速库,用户可通过调用API接口的方式开发应用。对于有固定应用开发流程的用户,建议采用此方式,借用Vision SDK提供算法加速能力构建CV应用。
- 通过流程编排方式开发:采用模块化的设计理念,将业务流程中的各个功能单元封装成独立的插件。用户可以用流程编排的方式,通过插件的串接快速构建业务,进行应用开发。此方式提供常用功能插件,具备流程编排能力,提供插件自定义开发功能。
产品价值
Vision SDK致力于简化昇腾芯片推理业务开发过程,降低使用昇腾芯片开发的门槛。
- 降本增效:将传统视频图像处理通过NPU加速,大幅度提升计算性能,降低成本。
- 极简易用:封装NPU算法加速能力,方便应用直接调用,简化应用开发难度。
使用导引
Vision SDK用户指南用于引导开发者基于现有模型,通过Vision SDK API接口开发方式或流程编排方式实现目标识别、图像分类等功能。
通过用户指南,您可以了解到以下内容:
- Vision SDK软件架构、基本概念以及各开发方式对应的使用流程。
- 如何使用Vision SDK API接口进行应用开发,如何通过流程编排插件实现应用。
拥有C/C++、Python语言开发能力,对推理应用开发有一定了解的开发者,可更好的理解该产品。
初次使用,建议先了解各开发方式具体流程,通过快速入门具体了解各开发方式的风格特点,选择适合实际业务和理解习惯的开发方式,再通过对应的章节学习、开发Vision SDK应用。