没有Dead ReLU 问题,输出的平均值接近0,以0 为中心; · ELU 通过减少偏置偏移的影响,使正常梯度更接近于单位自然梯度,从而使均值向零加速学习; · ELU 在较小的输入下会 ...
確定! 回上一頁