下载
中文
注册
倍级性能
使用MindIE,模型推理吞吐数倍提升,时延大幅降低,推理成本大幅下降
极简部署
MindIE支持单机、多机、大规模专家并行等极简的推理部署
降低负载
通过高效内存管理,KVCache压缩等多种优化技术,降低大量负载
开放兼容
支持MindIE Service服务化,以及vLLM、OpenAI、Triton等多种接口

MindIE助力昇腾易部署、高性能推理

MindIE视图生成
通过MindIE SD进行高性能视图生成推理和可视化
MindIE文本生成
通过MindIE LLM进行文本生成推理,服务化端到端推理全流程加速
第三方引擎推理
昇腾平台支持开源和客户自研推理引擎如vLLM等,并为其提供推理加速
应用使能(RAG、Agent等)
MindIE 推理引擎
推理服务
推理模型套件
加速套件
MindIE Service 昇腾推理服务
MindIE SD 多模态生成
MindIE LLM 文本生成
vLLM / SGLang 文本生成
MindIE Turbo 推理模型加速库
MindIE SD 多模态生成
MindIE SD是视图生成加速套件,提供了一系列的软件加速方案,提高视图生成性能。

了解关键场景的核心技术

服务化集成部署
提供全面易用的服务化能力,提供自研方案和开源方案,方便业务集成部署
  • 开放的MindIE服务化部署MindIE服务化开放支持多种第三方API ,如Triton、OpenAI,TGI,vLLM等,支持调用、会话管理、请求调度等
  • vLLM开源生态全面支持通过vLLM Ascend开源项目,vLLM开源全面支持昇腾,核心特性全面支持

开发资源

快速上手
在线的开箱5步视频,帮助你轻易上手MindIE的使用之路
进阶学习
提供丰富的在线的课程,带你进一步学习MindIE的相关知识,成为专家
开发文档
查看MindIE产品技术文档,了解更多详细技术细节
开源项目
了解MindIE与开源社区的合作项目,其中包括昇腾vLLM适配层开源项目vllm-ascend等,点击查看开源项目内容
模型支持列表
MindIE支持的大语言和多模态模型及版本
点击推理开发,获取推理场景相关资源

客户案例