[Solution found!] 直接来自维基百科: 当设备不工作时,泄漏的ReLU允许一个小的非零梯度。 参数ReLU通过将泄漏系数作为一个参数与其他神经网络参数一起学习, ...
確定! 回上一頁