文档
注册

分析功能与输入数据的对应关系

专家系统工具一次执行输出所有子功能的分析结果,但不同功能要求的输入数据不同,本章节介绍分析功能与输入数据的对应关系。如表1所示。

表1 分析功能与输入数据的对应关系

瓶颈识别功能

文件

获取方式

基于Roofline模型的算子瓶颈识别与优化建议

cce代码

可通过ATC工具添加--op_debug_level=4得到,或用户自行在算子编译时保存。参见ATC工具使用指南

Profiling Task Scheduler任务调度信息数据文件

启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。

OM离线模型文件

可通过多种方式生成,例如ATC工具转换,参见模型转换和调优

基于Timeline的AI CPU算子优化

Profiling Task Scheduler任务调度信息数据文件

启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。

OM离线模型文件

可通过多种方式生成,例如ATC工具转换,参见模型转换和调优

算子融合推荐

Profiling Summary文件

使用op_Summary.csv文件和l2_cache.csv文件,启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。

OM离线模型文件

可通过多种方式生成,例如ATC工具转换,参见模型转换和调优

TransData算子识别

Profiling Summary文件、Profiling基本信息文件(主要获取文件中当前芯片版本的基本信息)

参见启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。

OM离线模型文件

可通过多种方式生成,例如ATC工具转换,参见模型转换和调优

算子优化分析

算子仿真文件

通过tmmodel仿真得到。参见算子开发完成算子工程的创建和开发,运行算子UT测试即可,无需手动获取文件。

输入数据文件名及保存路径请参见输入数据获取

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词