AdamW 是由fast.ai 推广的一种具有权重衰减(而不是L2 正则化)的Adam,在PyTorch 中以torch.optim.AdamW 实现。AdamW 似乎在误差和训练时间上都一直 ...
確定! 回上一頁