1. weight decay(权值衰减)的使用既不是为了提高你所说的收敛精确度也不是为了 ... 如果我没有理解错的话,题主的意思应该是batch normalization ...
確定! 回上一頁