参考基准:多次训练验证精度一致
目标
基准模型多次训练需要得到相同的结果预期。
以下章节中如未特别注明,多次训练均需满足“未固定随机性”的前提。
思路
如果基准模型的多次训练相互对比不满足精度对比要求,那么该参考基准不适合用于精度对比,相应分析思路为:
- 模型算法稳定,不引起多次训练较大结果偏差。
- 数据集质量较高,不引起多次训练较大结果偏差。
- 超参稳定,不引起多次训练较大结果偏差。
参考步骤
对于成熟模型(即hyperparameter borrowing):
- 检查执行时使用的超参,确保与给定基准一致。
- 对于集群训练,检查集群训练模式,确保与给定基准一致。
- 检查数据集文件,确保与给定基准一致。
- 检查模型代码与执行参数,确保构造的计算逻辑与给定基准一致。
- 进一步检查计算图,确保计算流程与算子维度与给定基准一致。
- 重新训练模型并验证最终模型准确度。如果仍旧未达到基准,重复以上检查直到与基准一致。
- 重复三次以上的训练,确保每次训练的验证准确度均能够与基准一致。如果有不一致现象,重复以上检查直到满足各步骤需求。
对于成熟模型自定义超参:
- 如果数据集文件为自定义样本,需要确保标记信息没有错误,且格式符合模型的设计预期。
- 如果无法确认数据集文件的准确性,请直接使用成熟模型提供的数据集(可进行适当裁剪)。
- 以成熟模型的原始超参为基准,基于实际训练数据集与集群规模进行修改,得到一组待测超参。
- 重复三次以上的训练,确保每次训练的验证准确度均一致。如果有不一致的现象,重复以上检查直到满足各步骤需求。
对于自定义模型:
- 确保数据集标记没有错误。
- 选定一组调试时稳定的待测超参。
- 重复三次以上的训练,确保每次训练的验证准确度均一致。如果有不一致的现象,调整超参、模型结构并重复以上检查,直到满足各步骤需求。
父主题: 检查参考基准脚本