torch.optim集成瞭很多優化器,如SGD,Adadelta,Adam,Adagrad,RMSprop等,這些優化器自帶的一個參數weight_decay,用於指定權值衰減率,相當於L2 ...
確定! 回上一頁