这篇文章主要介绍了正则化与偏差-方差分解,以及PyTorch 中的L2 正则 ... 得到的梯度,如果weight decay 不为0,那么更新$d_p=dp+weight_decay \times ...
確定! 回上一頁