AdamW 是由fast.ai 推廣的一種具有權重衰減(而不是L2 正則化)的Adam,在PyTorch 中以torch.optim.AdamW 實現。AdamW 似乎在誤差和訓練時間上都一直 ...
確定! 回上一頁