當前位置:妙知谷 >

關於AlphaGo的百科

通用AlphaGo誕生?MuZero在多種棋類遊戲中超越人類
  • 通用AlphaGo誕生?MuZero在多種棋類遊戲中超越人類

  • DeepMind的一項研究提出了MuZero算法,該算法在不具備任何底層動態知識的情況下,通過結合基於樹的搜索和學得模型,在雅達利2600遊戲中達到了SOTA表現,在國際象棋、日本將棋和圍棋的精確規劃任務中可以匹敵AlphaZero,甚至超過了提前得知規則的圍棋版AlphaZero。MuZero算法在國際...
  • 18685
自學圍棋的AlphaGo Zero,你也可以造一個
  • 自學圍棋的AlphaGo Zero,你也可以造一個

  • 遙想當年,AlphaGo的Master版本,在完勝柯潔九段之後不久,就被後輩AlphaGoZero(簡稱狗零)擊潰了。從一隻完全不懂圍棋的AI,到打敗Master,狗零隻用了21天。而且,它不需要用人類知識來餵養,成為頂尖棋手全靠自學。如果能培育這樣一隻AI,即便自己不會下棋,也可以很驕傲吧。於是,來自巴黎...
  • 17747
這是迄今為止,AlphaGo算法最清晰的解讀!
  • 這是迄今為止,AlphaGo算法最清晰的解讀!

  • 2016年DeepMind團隊(google旗下)的AlphaGo(一個圍棋的AI)以4:1戰勝頂尖人類職業棋手李世石。她到底是怎麼下棋的?AlphaGo在面對當前棋局時,她會模擬(推演棋局)N次,選取模擬次數最多的走法,這就是AlphaGo認為的最優走法。例如圖中,所有沒有落子的地方都是可能下子的,但在模擬中,右下...
  • 9638
100:0,新AlphaGo放棄了人類?
  • 100:0,新AlphaGo放棄了人類?

  • 2017年10月19日,谷歌子公司DeepMind發佈了AlphaGo的新版本。很多人知道AlpoaGo是一個人工智能程序,卻不知道它其實是一個家族,早期戰勝韓國選手李世石的是AlphaGoLee。在烏鎮擊敗世界冠軍柯潔的是AlphaGoMaster。本次發佈的是AlphaGoZero(阿爾法零),它經過3天的訓練便以100:0的...
  • 8874
AlphaGo的神奇全靠它,詳解人工神經網絡!
  • AlphaGo的神奇全靠它,詳解人工神經網絡!

  • Alphago在不被看好的情況下,以4比1擊敗了圍棋世界冠軍李世石,令其名震天下。隨着AlphaGo知名度的不斷提高,人們不禁好奇,究竟是什麼使得AlphaGo得以戰勝人類大腦?AlphaGo的核心依託——人工神經網絡。什麼是神經網絡?人工神經網絡是一種模仿生物神經網絡(動物的中樞...
  • 17816
前世今生,帶你瞭解AlphaGo的發展歷程
  • 前世今生,帶你瞭解AlphaGo的發展歷程

  • 阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由位於英國倫敦的谷歌(Google)旗下DeepMind公司的戴維·西爾弗、艾佳·黃和戴密斯·哈薩比斯與他們的團隊開發,這個程序利用價值網絡去計算局面,用策略網絡去選擇下子。AlphaGo的主要設計者:大衞·席爾瓦(Davi...
  • 10025