从结果上来看,MuZero 使用model-based 的方法,在Go, chess 等棋类游戏以及Atari 游戏中 ... 2017. https://papers.nips.cc/paper/7192-value-prediction-network.pdf ...
確定! 回上一頁