提出原因使用Sigmoid 激活函数时如果数据的分布范围较大,训练时容易出现梯度弥散现象,因此提出了Batch Normalization的方法另外,从另一个角度,如果输入的数据大小 ...
確定! 回上一頁