強化學習被普遍用於訓練遊戲AI ,人類告訴AI 一種遊戲的得分獎機制,但卻不教授遊戲方法,由AI 反覆進行遊戲、努力爭取更高分的過程中自我進化。 AlphaGo 就完全擯棄了人類 ...
確定! 回上一頁