--op_select_implmode
功能说明
选择算子是高精度实现还是高性能实现。
高精度是指在fp16输入的情况下,通过泰勒展开/牛顿迭代等手段进一步提升算子的精度;高性能是指在fp16输入的情况下,不影响网络精度前提的最优性能实现。
关联参数
无。
参数取值
参数值:
- high_precision:表示算子选择高精度实现。
- high_performance:表示算子选择高性能实现。
参数默认值:high_performance
推荐配置及收益
无。
示例
--op_select_implmode=high_precision
依赖约束
使用约束:
--op_select_implmode参数表示设置所有算子的高精度或高性能模式,如果算子实现了高精度和高性能,则运行时选择--op_select_implmode参数指定的模式;如果算子只实现了一种,则按照算子实现的方式运行,例如:
某个算子当前只支持高精度,而--op_select_implmode设置为高性能,则--op_select_implmode参数对于该算子不生效,使用该算子当前实现的高精度方式运行。
父主题: 高级功能