简介

产品背景

计算机视觉（Computer Vision，以下简称“CV”）发展历程是一个不断探索和发展的过程。CV最初是为了实现计算机对数字图片的简单处理而产生的，研究内容主要包括图像处理、模式识别、机器学习、深度学习等方面。在智能视频分析（Intelligent Video Analytics，以下简称“IVA”）行业中，传统计算常见算法的应用领域有很多，例如目标识别、视频结构化、动作行为识别等。

随着硬件技术和算法的不断进步，视频与图像已逐渐成为全球互联网流量的主要组成部分。随着媒体服务的快速增长，AI图像算法基础的视频图像处理，逐渐成为计算流程中的成本壁垒和性能瓶颈。在此背景上，Vision SDK致力于视频图像处理算法加速，提升视频图像处理性能，降低CV应用的开发复杂度，加速CV应用开发部署。

产品定义

Vision SDK是MindSDK中面向图片和视频视觉分析的SDK，提供了基本的视频、图像智能分析能力及编程框架。

通过API接口方式开发：提供原生的推理API以及算子加速库，用户可通过调用API接口的方式开发应用。对于有固定应用开发流程的用户，建议采用此方式，借用Vision SDK提供算法加速能力构建CV应用。
通过流程编排方式开发：采用模块化的设计理念，将业务流程中的各个功能单元封装成独立的插件。用户可以用流程编排的方式，通过插件的串接快速构建业务，进行应用开发。此方式提供常用功能插件，具备流程编排能力，提供插件自定义开发功能。

产品价值

Vision SDK致力于简化昇腾芯片推理业务开发过程，降低使用昇腾芯片开发的门槛。

降本增效：将传统视频图像处理通过NPU加速，大幅度提升计算性能，降低成本。
极简易用：封装NPU算法加速能力，方便应用直接调用，简化应用开发难度。

使用导引

Vision SDK用户指南用于引导开发者基于现有模型，通过Vision SDK API接口开发方式或流程编排方式实现目标识别、图像分类等功能。

通过用户指南，您可以了解到以下内容：

Vision SDK软件架构、基本概念以及各开发方式对应的使用流程。
如何使用Vision SDK API接口进行应用开发，如何通过流程编排插件实现应用。

拥有C/C++、Python语言开发能力，对推理应用开发有一定了解的开发者，可更好的理解该产品。

初次使用，建议先了解各开发方式具体流程，通过快速入门具体了解各开发方式的风格特点，选择适合实际业务和理解习惯的开发方式，再通过对应的章节学习、开发Vision SDK应用。