RMSProp 算法(Hinton,2012)修改AdaGrad 以在非凸情况下表现更好,它改变梯度累积为指数加权的移动平均值,从而丢弃距离较远的历史梯度信息。RMSProp 与Adadelta 的 ...
確定! 回上一頁