作者asglay (收收收尾)
看板chess
標題Fw: [情報] AlphaZero戰勝將棋與西洋棋最強軟體
時間Thu Dec 7 00:15:41 2017
※ [本文轉錄自 GO 看板 #1Q9-Ito- ]
作者: HeterCompute (異質運算) 看板: GO
標題: [情報] AlphaZero戰勝將棋與西洋棋最強軟體
時間: Wed Dec 6 20:38:11 2017
https://arxiv.org/pdf/1712.01815.pdf 這次論文的標題是:
Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm
從零學棋,
使用相似的神經網路架構,
一樣沒有使用任何人類知識,
4小時打敗西洋棋最強軟體Stockfish,
2小時打敗將棋最強軟體Elmo,
34小時打敗圍棋AlphaGoZero 20blocks 3天版本,
(圍棋其實有些爭議,因為他這次用了5000TPU,上次AlphaGoZero只用2000TPU),
以MCTS打倒傳統的alpha beta search,
通用於完全訊息遊戲,
又一偉大的突破。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.176.30
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1512563895.A.CBE.html
推 staristic: 一個通用於下棋的AI? 12/06 20:45
沒錯
推 tetratio: 又達到新境界了 12/06 20:50
推 BBSealion: 不知道限制多嚴格,有運氣成分的(例如暗棋)或多人的 12/06 20:54
→ BBSealion: (例如跳棋)不知道能否通用過去 12/06 20:54
暗棋這種非完全訊息遊戲很難說,跳棋這種只有多人應該沒什麼問題。
※ 編輯: HeterCompute (118.169.176.30), 12/06/2017 20:56:17
推 birdy590: 力王:大家可以回家啦~ 12/06 20:55
推 harrybbs: 逆天啦 發展這麼快 12/06 20:59
推 dongy: 暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類 12/06 21:01
→ dongy: 棋手會有一定勝率 12/06 21:02
推 TWN2: 想看阿法零跟赤木茂打麻將 12/06 21:04
推 zeat: AlphaGO老師:我是說在座的各位都是__ 12/06 21:06
推 aegis43210: 已經征服完全訊息遊戲了,希望星海二也會有突破 12/06 21:15
推 s891234: 真的是在座的各位都是哈哈,可以回家啦~~~ 12/06 21:41
→ Lordaeron: 多人跟雙人是有很多不同,沒問題就有鬼囉. 12/06 21:43
推 turing: 這也終結了西洋棋的西西里防禦。 12/06 22:22
推 MonkeyCL: 這世界變化太快好累啊 12/06 22:35
推 hne: 太強了 O o 12/06 22:52
推 asglay: 借轉chess 12/07 00:11
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: asglay (111.254.37.40), 12/07/2017 00:15:41
→ ssccg: 雖然演算法很強,但是真的有資源能玩更是關鍵... 12/07 00:35
→ ssccg: 不知道在電王的規則下多強就是了 12/07 00:40
推 lwei781: 應該差不多強 耗資源的部分是訓練 12/07 01:43
→ ssccg: 實戰用的是4TPU,先不說電王沒TPU,TPU是CPU的幾十倍吧? 12/07 02:30
→ ssccg: 64T vs 4TPU感覺不算公平,當然再多訓練下去一定是Alpha強 12/07 02:39
推 NewYAWARA: 請他們明年到電王戰比一次就知道了,現在的elmo也不是 12/07 10:11
→ NewYAWARA: 最強,而且大家有被限制統一硬體規格 12/07 10:11
→ fossil313: 跟StockFish每秒搜尋7000k比 AlphaZero只有搜尋80k 12/07 12:25
→ fossil313: 感覺應該是沒什麼懸念了 12/07 12:25
→ ssccg: 在一個node上要做的evaluation不同,不能比NPS吧 12/07 12:58
→ ssccg: AlphaZero比較強是一定的,只是好奇TPU優化的程式用4TPU跑 12/07 13:01
→ ssccg: 要改寫成一般CPU能跑的話會是要多少CPU才有同樣強度 12/07 13:02
推 NewYAWARA: 後來測試最新tanuki確實是比elmo強 12/07 20:16
推 kcl0801: 新電王ぽんぽこ近日直播時正式上線 被日本觀眾嫌的要死xd 12/08 13:10
→ kcl0801: 因為預測的太短視 剛上直播時常常只預測下一步 昨天看時 12/08 13:10
→ kcl0801: 好一點 可是在畫面上有預測後9步的空間 却完美的只預設了 12/08 13:10
→ kcl0801: 8步空一格... 12/08 13:10
→ ssccg: 那是UI和探索引擎配合的問題吧 12/08 13:52