검색 없는 그랜드마스터 수준 체스

▲

GN⁺ 2024-10-19 | parent | ★ favorite | on: 검색 없는 그랜드마스터 수준 체스(github.com/google-deepmind)

Hacker News 의견

사용자가 원하는 수준의 체스 상대를 찾기 어려움. 대부분의 엔진은 검색 깊이를 줄여 난이도를 낮추지만, 이는 효과적이지 않음
- 사용자는 인간 플레이어처럼 느껴지는 컴퓨터 상대를 원함
한 사용자는 체스와 관련된 지식 증류에 대한 발표를 했으며, 복잡한 비선형 검색 기능을 체스와 같은 표준 입력에 대해 준선형 변환기 모델로 증류하는 방법을 설명함
체스 신경망에 관심이 있는 사람들에게 PyTorch를 사용한 쉬운 코드와 현재 최고 성능의 체스 신경망과 유사한 아키텍처를 제공하는 GitHub 저장소를 추천함
LC0 네트워크와 DeepMind의 변환기 네트워크를 비교한 블로그 게시물이 있음
"Grandmaster-Level Chess Without Search" 논문은 대규모 주의 기반 아키텍처와 데이터셋의 중요성을 강조하며, 270M 파라미터 변환기 모델을 사용하여 체스를 학습함
- Stockfish 16 엔진을 사용하여 10억 개 이상의 데이터 포인트를 생성하고, 인간과의 Lichess blitz Elo 2895를 달성함
- AlphaZero의 정책 및 가치 네트워크를 능가함
대규모 합성 데이터셋은 전통적인 검색을 사용하여 생성되었으며, 이는 변환기 모델에 검색 트리를 인코딩하는 것과 같음
Matthew Sadler는 Leela Zero를 직관적으로 플레이하도록 설정했으며, 이는 검색 없이도 효과적으로 훈련 게임을 수행함
체스를 해결하면 너무 큰 트리가 생성되며, 이를 최적화하기 위한 두 가지 접근법이 있음
- 트리를 근사화하고 주석을 근사화하는 것
- 270M 단어의 데이터로 트리를 근사화할 수 있음
FEN 문자열을 고정 길이 문자열로 변환하여 보드 상태를 인코딩하고, UCI 표기법을 사용하여 행동을 저장함
- 문제 변형마다 토크나이저를 재작성해야 한다면 이는 단순한 프로그래밍임