當前位置:妙知谷 >

關於MuZero的百科

通用AlphaGo誕生?MuZero在多種棋類遊戲中超越人類
  • 通用AlphaGo誕生?MuZero在多種棋類遊戲中超越人類

  • DeepMind的一項研究提出了MuZero算法,該算法在不具備任何底層動態知識的情況下,通過結合基於樹的搜索和學得模型,在雅達利2600遊戲中達到了SOTA表現,在國際象棋、日本將棋和圍棋的精確規劃任務中可以匹敵AlphaZero,甚至超過了提前得知規則的圍棋版AlphaZero。MuZero算法在國際...
  • 18685