DeepMind, AlphaGo와 AlphaZero의 핵심을 오픈소스로 공개

xguru · 2023-02-17T14:33:34+09:00

Mctx(MCTS-in-JAX)라고 이름 붙여진 Repo 내부에 있음 Monte Carlo Tree Search(MCTS) 알고리듬을 JAX-native로 구현한 엄청 빠른 라이브러리 턴 기반의 게임에서 "선택→확장→시뮬레이션→전략 트리 노드 업데이트" 방식으로 최고의 이동을 선택하는 검색 알고리듬 AlphaGo 의 가장 복잡한 컴포넌트이고, 이걸 효율적으로 만드는게 정말 중요함 AlphaGo 뿐만 아니라, AlphaZero(Go,Chess,Shogi) 와 MuZero(AlphaZero + Atari 게임) 등에도 이용됨

(twitter.com/DrJimFan)

8P by xguru 2023-02-17 | ★ favorite | 댓글 1개

Mctx(MCTS-in-JAX)라고 이름 붙여진 Repo 내부에 있음
Monte Carlo Tree Search(MCTS) 알고리듬을 JAX-native로 구현한 엄청 빠른 라이브러리
- 턴 기반의 게임에서 "선택→확장→시뮬레이션→전략 트리 노드 업데이트" 방식으로 최고의 이동을 선택하는 검색 알고리듬
AlphaGo 의 가장 복잡한 컴포넌트이고, 이걸 효율적으로 만드는게 정말 중요함
AlphaGo 뿐만 아니라, AlphaZero(Go,Chess,Shogi) 와 MuZero(AlphaZero + Atari 게임) 등에도 이용됨

xguru 2023-02-17 [-]

이 트윗자체는 HN에서 본 건데 https://news.ycombinator.com/item?id=34801636
실제로 이 Repo는 공개된지 약 1년은 되었고, 이게 전체 AlphaGo는 아니라고 제목 낚시 아니냐고 비난하는 댓글도 있긴 합니다.
원래 AlphaGo의 구현체는 tensorflow/TPU 이고, 이건 JAX로 재구현한 것 뿐이라고도 하네요.

답변달기

DeepMind, AlphaGo와 AlphaZero의 핵심을 오픈소스로 공개

함께 보면 좋은 글 β

댓글과 토론