class AdamW(params, lr, betas=(0.9, 0.999), eps=1e-08, weight_decay=0.01)[源代码]¶. 论文“Decoupled Weight Decay Regularization” 中AdamW 算法的实现.
確定! 回上一頁