為此,對於「超級簡略的單股買賣模擬器」的環境必須要修改一下,以及如何定義我們的 loss (就是 reward 的相反)。 在這篇,我並不會將 state 回傳至模型更新,單純只有 ...
確定! 回上一頁