雖然這篇四子棋ai鄉民發文沒有被收入到精華區:在四子棋ai這個話題中,我們另外找到其它相關的精選爆讚文章
在 四子棋ai產品中有1篇Facebook貼文,粉絲數超過1萬的網紅大詩人的寂寞投資筆記,也在其Facebook貼文中提到, 「你好,我是王爍。 這一講,我想跟你討論一個,我最近的認知收穫。 我這輩子棋力最強的時候,曾經拿過北京大學生圍棋比賽冠軍。從那時到現在,人類圍棋最輝煌的時代我經歷過了,AI統治的降臨我也見證了。 人下圍棋要講棋理,但今天AI不給你講棋理,問工程師也沒用,他也沒法告訴我AI是怎麼「思考」的...
四子棋ai 在 大詩人的寂寞投資筆記 Facebook 的最佳解答
「你好,我是王爍。
這一講,我想跟你討論一個,我最近的認知收穫。
我這輩子棋力最強的時候,曾經拿過北京大學生圍棋比賽冠軍。從那時到現在,人類圍棋最輝煌的時代我經歷過了,AI統治的降臨我也見證了。
人下圍棋要講棋理,但今天AI不給你講棋理,問工程師也沒用,他也沒法告訴我AI是怎麼「思考」的:深度學習是個黑箱,就跟大腦是個黑箱一樣。
要跟AI學棋,就得用到《30天認知訓練營·2019》里講過的三種反饋學習方法中的模仿。由表及裡,從它下在棋盤上的棋步,去倒推內在的邏輯,先回溯,再模仿。
雖然並不存在絕對靠譜的方法,來判定剖析到了哪一層真正管用,雖然通過模仿獲得的認知日後多半會發現很淺薄,但沒有更好的辦法。
模仿AI,我學到這些心得:
第一,棋沒那麼容易死,與什麼棋都可以死,這兩句話同時成立。棋沒那麼容易死,每個子死的時候都獲得了對價,才能死得其所。什麼棋都可以死,所以不用怕死,倒是怕死反而會死得很不值。
第二,天大地大,先手最大。幾乎是無論什麼時候,如果一個地方不會下了,那就脫先,也就是換到別的地方落子。脫先總能得九十分,要是不離不棄,長考出一套精妙打法,反而經常不及格:一頓操作猛如虎,勝率就掉二十五。
第三,把每一步都當作第一步來思考。無論上一步有什麼構思,這一步都要忘掉重來。正因如此,打臉不要緊,反正還要打。漫漫長路,你還要打自己的臉很多次。
總之,人類下圍棋下不過AI至少有三個原因:太怕死,太戀舊,太要臉。
馬爾可夫過程
豈止下圍棋是這樣!看到我的這些心得,我的朋友,軟件工程師木遙說這就是個馬爾可夫過程。他這樣講:
生活里的很多事都是馬爾可夫過程。
也就是說,之前到達這一刻的路徑並不重要,千百種可能的過往路徑歸結為此刻的現實,能賴以對未來作出判斷的依據也只有此刻本身。你應該永遠像是一個在棋局進行到這一步的時候,才被邀請來坐在棋盤前的棋手一樣,開始重新思考。
但人們通常做不到這一點。
你持有一個股票倉位,你就沒法忘了自己是在什麼時候建的倉。你投入心力做了一件事,你就不知道該何時撒手。你把過去講成了一個故事,你就自覺有義務要讓未來遵循這個故事的邏輯。捨不得,放不下,輸不起,贏不夠。人是自我敘事的奴隸。
該翻篇兒的時候就要翻篇兒,每天的太陽都是新的。
說到馬爾可夫過程,把木遙的話總結成一句,說到馬爾可夫過程就是這樣的: 未來只與現在有關,而與歷史無關。
這話里有冷峻的詩意:AI就是這樣下棋的,股市大多數時候也是這樣運動的,在《30天認知訓練營·2019》里講,不要清空存量,要清空存量思維,也是同一個道理。
但到這裡還不是盡頭,我們可以再往下多走一步,馬爾可夫過程的道理還有更深一層。
為什麼在馬爾可夫過程中,未來與歷史無關?
給你舉個例子,假設你的閒暇時間只用來做兩件事,讀書和玩手機。在這裡,讀書是一種狀態,玩手機是另一種狀態。
我們再假設,你在這兩種狀態之間相互切換的概率是固定的。假設你正在讀書,那就有6成概率會繼續讀下去,而有4成概率會轉過去玩手機;再假設你要是正在玩手機,那就有9成概率繼續玩下去,而只有1成概率會轉過去讀書。
在此,我已經提到了馬爾可夫過程的四個前提:
第一,狀態的數量是有限的,這裡只有兩種狀態:玩手機、讀書;
第二,狀態之間切換的概率是固定的,這裡指的是你讀書時轉過去玩手機的概率,或者你玩手機時轉過去讀書的概率,它是固定的;
第三,遍歷性,也就是所有狀態都有可能會出現;
第四,非週期性,也就是它不會是單一的一個過程反復循環,周而復始。
馬爾可夫過程的四個前提如果同時成立,那麼,不論最初你在讀書和玩手機上怎麼分配時間,也不論後來經過了多長時間,有多少次反復,最終都只有一個結果:
你80%的時間用於玩手機,20%的時間用於讀書。
只要到了這裡,你就出不來了。算一算,八成時間用於玩手機,兩成用於讀書,這時,你從玩手機切換成讀書的時候有10%乘以80%等於8%,而你從讀書切換到玩手機的時候有20%乘以40%,也等於8%,兩者正好抵消。只要你達到這個均衡,你就鎖死在這個均衡里出不來了。
哪怕你最開始是100%的時間都用來讀書,你最後也會掉到80%的時間用來玩手機的結果中去。
只要是一個馬爾可夫過程,總是會結束於一個統計均衡(unique statistical equilibrium)。正是在這個意義上,歷史無足輕重,因為無論初始狀態是什麼,無論過程中作何干預,無論路徑怎樣展開,最後都會掉入模型設定的長期均衡,並且就停在那裡了。未來與歷史無關,因為不論歷史是怎麼發生的,未來已經注定。
對馬爾可夫過程的理解,不能缺少了這一環。
所以說, 如果你想改變你現在的狀態,關鍵不是從哪裡出發,也不是過程中你要作哪些干預。你要做的是改變轉移的概率。
轉移概率就是,你在讀書時是繼續讀呢,還是轉過去玩手機,你在玩手機時是繼續玩呢還是轉過去讀書,這兩件事的概率。不改變這兩個概率,你起初花再多的時間來讀書,過程中你拿起書的次數再多,你還是會掉進同一個坑里。不信你就算一算。
同樣的道理適用於其他問題。
比如說管理情緒,在放鬆與焦慮之間,如果你想減少焦慮,指望休假重啓充電是不行的,未來與歷史無關。想要減少焦慮,你得在放鬆的時候能夠更多地保持放鬆,而在焦慮的時候能更多地走出焦慮,你得改變轉移概率。
同樣,授人以魚,不如授人以漁。如果不提升人們從窮困狀態轉到富裕狀態的轉移概率,也就是增加窮人的致富能力和機會,那麼無論你給窮人多少錢,最終還是會有同樣比例的人群陷於貧困。社會花了許多資源,最後什麼也不會改變。
本講小結
總結一下,鎖死在壞的均衡里是災難,鎖死在好的均衡里,好結果會自己發生。從壞均衡的馬爾可夫過程變成好均衡的馬爾可夫過程,你必須改變轉移概率。
前兩年韓國駐華大使送了一幅字給中國領導人,最近韓國議長訪美又手書同一幅字給美國國會眾議院議長。同樣四個字:萬折必東。
四個字兩頭送,雖然有一點點滑稽,但跟今天講的馬爾可夫過程契合:
不論從哪裡開始,是從唐古拉山還是崑崙山,不論過程中有多少曲折,是黃河九曲還是長江十八灣,水下一步往哪裡流,都只跟現在這一步有關,每一步都是水往下流,那麼它最終一定東流入海。
今天我也把這四個字送給你:如果你執行了錯誤的轉移概率,馬爾可夫過程是你的天敵;反過來說,如果你執行了正確的轉移概率,馬爾可夫過程是你最好的推手。不論起點高低,過程難易,它將你一步步送往屬於你的那個均衡。
萬折必東。
思考題
照例出個思考題:
生活中還有哪些事是馬爾可夫過程,又有哪些不是,還有哪些它很可能經常是,但不應該是?
新書上線
宣佈個消息,我的新書《跨界學習》就要上線了,這本書脫胎於《30天認知訓練營·2018》的課程內容。
「得到」給學習了我課程的用戶,準備了提前購買的優惠,如果你感興趣可以點擊下方的圖片鏈接,進一步瞭解。」