文档
注册

迁移流程

基于ATB高性能加速库提供的基础算子和组图接口,构建与原始模型计算图等价的加速库图,如图1所示,整体流程可以总结为以下几个部分:

图1 基于ATB高性能加速库迁移流程
  1. 模型迁移分析:基于原始在线推理代码梳理模型计算图,主要包含模型拓扑关系、算子列表、输入输出Shape信息等,具体请参见模型迁移分析
  2. 框架接口调用:实现Layer/Model层后,可以在PyTorch侧通过加速库提供的API接口实现推理,替换原始的推理接口,具体请参见框架接口调用
  3. 测试验证:从精度、性能维度验证模型迁移是否存在损失,具体请参见测试验证

    如有调优需求,您可使用昇腾提供的大模型推理精度工具对大模型进行精度调优,使用性能分析工具对大模型进行性能调优

  4. (可选)服务化调度推理对接:完成迁移流程后,可选择对接服务化框架,具体请参见服务化调度推理
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词