Deep Q-network (DQN) 在前一篇Atari 的paper 介紹過,簡單來說就是用neural network 來預測Q(s, a)。Input 是state,可以是連續值,而output 總數等於action 的數量, ...
確定! 回上一頁