雖然這篇CartPole v0 vs v1鄉民發文沒有被收入到精華區:在CartPole v0 vs v1這個話題中,我們另外找到其它相關的精選爆讚文章
在 cartpole產品中有3篇Facebook貼文,粉絲數超過1萬的網紅DeepBelief.ai 深度學習,也在其Facebook貼文中提到, 新的強化學習影片系列--超級瑪莉 從cartpole試手完後,我們將要用強化學習挑戰更難一點的任務:打超級瑪莉。這個任務將會分三支影片來介紹,首先是【技術理論篇】針對這次強化學習所用的算法PPO(近端策略優化)做介紹,當然也是設計成即使是無基礎者也能理解的淺顯說明,這影片將在晚上8點首播。 之後...
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
cartpole 在 DeepBelief.ai 深度學習 Facebook 的最讚貼文
新的強化學習影片系列--超級瑪莉
從cartpole試手完後,我們將要用強化學習挑戰更難一點的任務:打超級瑪莉。這個任務將會分三支影片來介紹,首先是【技術理論篇】針對這次強化學習所用的算法PPO(近端策略優化)做介紹,當然也是設計成即使是無基礎者也能理解的淺顯說明,這影片將在晚上8點首播。
之後還有介紹實作模擬器環境與wrapper的【前置準備篇】以及直接實現代碼的【落地開玩篇】,超級瑪莉挑戰完後還要挑戰甚麼任務呢...魔術方塊....敬請期待....
https://youtu.be/Qj6XBRAeevE
cartpole 在 DeepBelief.ai 深度學習 Facebook 的最讚貼文
新課程影片上架
CartPole實作篇:Policy Gradient
https://youtu.be/viTUSohxb9Y
cartpole 在 DeepBelief.ai 深度學習 Facebook 的精選貼文
新課程影片上架
上次發佈了Cartpole理論篇介紹DQN與Policy Gradient的理論介紹,這次是代碼實作,介紹可以使用哪些trick能在第100個回合就直接達標前100回合平均獎賞195以上的任務要求
影片今晚08:30首播
https://youtu.be/sVWBj52ZenI