DeepMind, AlphaGo와 AlphaZero의 핵심을 오픈소스로 공개
(twitter.com/DrJimFan)- Mctx(MCTS-in-JAX)라고 이름 붙여진 Repo 내부에 있음
- Monte Carlo Tree Search(MCTS) 알고리듬을 JAX-native로 구현한 엄청 빠른 라이브러리
- 턴 기반의 게임에서 "선택→확장→시뮬레이션→전략 트리 노드 업데이트" 방식으로 최고의 이동을 선택하는 검색 알고리듬
- AlphaGo 의 가장 복잡한 컴포넌트이고, 이걸 효율적으로 만드는게 정말 중요함
- AlphaGo 뿐만 아니라, AlphaZero(Go,Chess,Shogi) 와 MuZero(AlphaZero + Atari 게임) 등에도 이용됨
이 트윗자체는 HN에서 본 건데 https://news.ycombinator.com/item?id=34801636
실제로 이 Repo는 공개된지 약 1년은 되었고, 이게 전체 AlphaGo는 아니라고 제목 낚시 아니냐고 비난하는 댓글도 있긴 합니다.
원래 AlphaGo의 구현체는 tensorflow/TPU 이고, 이건 JAX로 재구현한 것 뿐이라고도 하네요.