注:这个例子简单,实用(改改就能用到别的简单问题),但是并不能让人明白q-learning到底是啥,如果想明白强化学习是啥,解决的MDP问题是啥,建议还是踏踏实实看看Sutton的 ...
確定! 回上一頁