Ptt 大爆卦 | 期望值白話 - 前往 https://hackmd.io/@shaoeChen/Syez2AmFr

你即將離開本站

並前往https://hackmd.io/@shaoeChen/Syez2AmFr

李宏毅_ATDL_DRL Lecture 2 - HackMD

跟環境互動的agent與訓練的agent同一個的時候，即為On-policy，若否為Off-policy，更白話 ... 期望值會是一樣的，但如果sample的次數不夠多，就可能會得到非常大的差別 ...

確定！回上一頁

查詢「期望值白話」的人也找了：

期望值例子

期望值應用

期望值計算機

期望值公式

期望值賭博

期望值符號

期望值負數

期望值大於1