产品

解决方案

产业资讯

支持与服务

产品

昇腾计算产业概述

资源下载中心

固件与驱动

Atlas系列硬件

开发者套件

异构计算架构

AI框架

昇思MindSpore

PyTorch框架适配

TensorFlow框架适配

训练加速库

昇腾推理引擎

全流程开发工具链

解决方案

行业应用

人工智能计算中心

解决方案

昇腾大模型解决方案

城市智能中枢

开发者

开发者主页

昇腾论坛主页

鲲鹏昇腾原生创新汇

下载

资源下载中心

固件与驱动

昇腾镜像仓库

兼容性查询助手

技术场景

昇腾原生开发

资源

专区

开发板专区 HOT

OpenLab

昇腾计算开放实验室

鲲鹏昇腾开发者大会2024

昇腾AI开发者创享日

昇腾学堂·活动广场

昇腾AI训练营-CANN训练营

大赛

昇腾AI创新大赛2024

昇腾AI原生创新算子挑战赛 HOT

中国国际大学生创新大赛2023

社区

昇腾社区APP

开发者计划

昇腾万里开发者计划

昇腾众智计划

昇腾荣誉顾问

原生创新汇会员

鲲鹏昇腾原生创新汇 NEW

合作伙伴

登录生态伙伴中心

合作伙伴

昇腾生态合作伙伴网络

昇腾万里伙伴计划

昇腾技术认证书查询

昇腾兼容性认证硬件目录

高校

高校人才发展主页

智能基座社团

虚拟教研室

人才发展计划

鲲鹏&昇腾产教融合育人基地

鲲鹏&昇腾本科教学推广计划

虚拟教研室教改专项计划

计算高校开源人才奖励计划

鲲鹏&昇腾原生人才高校促进计划

昇腾众智计划

鲲鹏昇腾科研创新使能计划

鲲鹏昇腾科教创新卓越中心/孵化中心

资源

活动与大赛

华为全联接⼤会2024⾼校系列活动

鲲鹏昇腾科教创新卓越中心/孵化中心特训营

中国国际大学生创新大赛2024

国家级大学生创新训练计划-华为命题2024

昇腾AI创新大赛2024

华为全联接大会2023高校系列活动

第六届中国软件开源创新大赛

华为软件精英挑战赛2023

高校资讯

昇腾AI市场

市场主页

市场分类

原生大模型

Powered by Ascend

产业资讯

WAIC 昇腾人工智能产业高峰论坛2024

鲲鹏昇腾开发者大会2024

资讯

支持与服务

支持与服务

文档

技术支持

自助查询

资讯

下载

中文

注册

内存优化

算子与高阶API共享临时Buffer
限制TilingData结构大小
通过K_MAX_SHAPE_DIM宏设置ShapeInfo维度为0，优化栈空间
UB Buffer融合
通过BT Buffer实现高效的bias计算
通过Fixpipe Buffer存放量化参数实现高效随路量化
通过L0C数据暂存实现高效的矩阵乘结果累加
矩阵长驻L1

父主题： 性能优化

版权所有 © 2021-2025华为技术有限公司保留一切权利粤A2-20044005号