也正因為 Monte Carlo 不需要任何模型,它也稱為無模型學習演算法。 Monte Carlo 方法的基本精神相當簡單。還記得在第 3 章「Markov 決策過程與動態規劃」中, ...
確定! 回上一頁