Newton:這個是有考慮到二次微分的,但是整體而言的成本不划算。 Learning Rate:慢慢調~可以做參數-Loss的變化,看看Loss下降的速度隨著epoch增加。調整的方式.
確定! 回上一頁