1)Batch_Size 增大到一定程度,其确定的下降方向已经基本不再变化。 2)太大的batch size 容易陷入sharp minima,泛化性不好。 3)Batch_Size 太小收敛太 ...
確定! 回上一頁