第 3 章 Markov 決策過程與動態規劃從介紹何謂 Markov 鍊與 Markov 流程開始,說明如何使用 ... 介紹如何使用各種探索策略來解決這個問題,例如 epsilon-貪婪、softmax ...
確定! 回上一頁