下面展示了DQN 和DDPG 在Bit Flipping (14 bits) 和Fetch Reach 环境中的表现,这些环境在论文Hindsight Experience Replay 和Multi-Goal ...
確定! 回上一頁