在常见的深度学习库中只提供了L2正则,并没有提供权重衰减的实现。 Adam+L2 VS AdamW. 图片中红色是传统的Adam+L2 regularization的方式,绿色是Adam+ ...
確定! 回上一頁