2.2 Q-learning 及DQN(Deep Q Network). Q-learning 是強化學習的一種方法,其主要目的就是要記錄下學習過的政策,. 因而告訴agent 什麼情況下採取什麼行動會有最大的 ...
確定! 回上一頁