epsilon-greedy的一种常见用法是所谓的多臂匪徒问题(multi-armed bandit problem)。 在这里插入图片描述. 假设你站在k = 3台老虎机前面。每台机器都会 ...
確定! 回上一頁