save_approximation_graph
功能说明
近似校准接口,删除插入的dump算子,替换用户校准的tf.graph中目标算子(Softmax)为昇腾亲和的高性能实现(FastSoftmax),并保存为既可在TensorFlow环境中进行精度仿真又可以在昇腾AI处理器部署的pb模型。
约束说明
无。
函数原型
save_approximation_graph(graph, ouptuts, save_path, config_defination=None)
参数说明
参数名 |
输入/返回值 |
含义 |
使用限制 |
---|---|---|---|
graph |
输入 |
用户传入的待近似模型的tf.Graph。 |
数据类型:tf.Graph |
outputs |
输入 |
graph中输出算子名称的列表。 进行算子替换可能会导致尾层输出节点变化,则此outputs列表也随之更新。 |
数据类型:list,列表中元素类型为string |
save_path |
输入 |
模型存放路径。 该路径若包含模型名前缀,则保存模型路径会增加后缀_approximation.pb,例如.传入/quantized_model/*model则模型保存为 /quantized_model/*model_approximation.pb。若不包含模型名前缀,则模型保存为approximation.pb。 |
数据类型:string |
config_defination |
输入 |
用户提供的近似校准配置文件路径,用于指定模型tf.Graph图中各层近似校准选项及导出校准数据的batch数。需要注意此配置需与create_approximation_calibrator中传入的配置一致。 |
数据类型:string |
返回值说明
无。
函数输出
完成近似校准的pb模型。
调用示例
1 2 3 4 5 6 |
result_model_path = './results/user_model' model_outptus = ['user_model_outputs0', 'user_model_outputs1'] amct.save_approximation_graph(graph=ori_graph, outputs=model_outptus , save_path=result_model_path, config_defination=None) |
父主题: 近似校准接口