以此範例來說,訓練是透過一個訓練演算法(training algorithm)來監督。 ... 疊代流程. 利用強化學習來訓練主體,所牽涉到嘗試錯誤的次數是相當可觀的,即使已經到較 ...
確定! 回上一頁