文档
注册

算法介绍

R-Drop算法是一种用于提升精度的微调算法,使用“进行两次dropout”的思想,增加随机扰动,提高模型的精度。

具体做法为在模型加载完一个batch的数据集之后,对一个batch中的输入数据进行复制,计算出logits并输入到loss计算函数中;在loss计算函数中,分别计算ce_loss和kl_loss,最终按照loss = ce_loss + kl_loss * alpha 的形式返回loss值(alpha为超参)。

实验结果表明,R-Drop算法能够有效提高模型的精度。 算法具体细节可参考相关论文R-Drop: Regularized Dropout for Neural Networks

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词