... 於電子遊戲的畫面,行動相當於按壓遊戲手把的哪個按鍵,而網路採用了擅長圖像辨識的 CNN。 ... 調整參數以輸出最佳的行動價值狀態4 −2 0 +1 +1 運用 ε-greedy 法等, ...
確定! 回上一頁