由於PyTorch 不會自動清零梯度,所以在每一次更新前會進行此操作。 ... else: buf = param_state['momentum_buffer'] buf.mul_(momentum).add_(d_p, ...
確定! 回上一頁