總共用到了三種model,過程中也感受到RL 真的不太容易訓練好。 ... Asynchronous Advantage Actor-Critic (A3C) 有個很讓人摸不著頭緒的名字,但原理並不難。
確定! 回上一頁