alphazero 是deepmind提出的一个算法,在不需要专家数据的前提下采用自博弈的方式进行训练, 在国际象棋中,AlphaZero训练4小时就超越了世界冠军程序Stockfish; ...
確定! 回上一頁