Differentiable 로직 셀룰러 오토마타

(google-research.github.io)

1P by GN⁺ 4달전 | ★ favorite | 댓글 1개

간단한 로컬 규칙에서 복잡한 패턴을 역설계하는 방법을 탐구
Neural Cellular Automata(NCA)의 학습 가능성과 Differentiable Logic Gate Networks를 결합해, 이산적 로컬 규칙을 학습 방식으로 얻는 접근
- "Conway's Game of Life 규칙을 학습해낼 수 있을까?"
- "NCA처럼 복잡 패턴을 재현하며, 시공간 순환 구조를 학습할 수 있을까?"

Introduction

Cellular Automata(CA)는 단순한 로컬 규칙에서 출발해, 복잡하고 예측하기 어려운 패턴을 형성함
전통적으로 CA에서는 규칙을 사람이 직접 설계했지만, 여기서는 목표 패턴이나 동작을 미리 주어 놓고, 이를 만족하는 로컬 규칙을 역으로 ‘학습’할 수 있는 방식을 소개함
특히 Neural Cellular Automata(NCA) 는 CA 구조에 딥러닝 기법을 결합해, 연속 공간에서 학습 가능하도록 설계되어 왔음
Differentiable Logic Gate Networks는 논리 게이트(AND, OR, XOR 등)를 연속적으로 근사해 학습하고, 최종적으로 다시 이산 논리회로로 변환하는 기법임
이 두 아이디어를 결합하여, DiffLogic CA라는 완전히 이산적이며 학습 가능한 CA 모델을 제안함
이는 프로그래머블 물질(Programmable Matter) 혹은 Computronium을 향한 작은 발걸음으로 볼 수 있음
본 글은 다음 흐름으로 진행됨
- Neural Cellular Automata 요약
- Differentiable Logic Gate Networks 요약
- 두 방법론을 결합한 DiffLogic CA 구조
- Conway’s Game of Life 규칙 학습 실험
- 복잡 패턴(체커보드, 도마뱀, 컬러 이미지 등) 생성을 위한 학습 실험

Recap – Neural Cellular Automata(NCA)

개념
- 전통적 CA 규칙을 뉴럴넷으로 학습 가능한 형태로 대체한 시스템임
- 각각의 셀이 여러 채널(state)을 가지고 로컬 상호작용을 통해 복잡한 패턴을 형성함
- Sobel 필터 등을 활용해 주변 정보를 얻고, 뉴럴넷이 상태 변화를 결정함
특징
- 모든 계산 과정이 미분 가능해, 원하는 패턴을 만들도록 학습할 수 있음
- 병렬성·로컬성·상태 기반 계산 등 CA 핵심을 유지하면서도 딥러닝 기법을 결합함

Recap – Differentiable Logic Gate Networks(DLGNs)

핵심 아이디어
- 전통적 NN 대신 논리 게이트(AND, OR, XOR 등)를 연속적으로 근사(soft gate)하여 학습함
- 학습 단계에서는 게이트가 연속적으로 동작하고, 최종 추론 시에는 실제 이진 연산을 수행하는 구조임
학습 과정
- 게이트의 16가지 가능한 논리 연산에 대한 확률 분포를 학습해, 최종적으로 특정 연산에 수렴함
- 연속 근사를 통해 미분 가능하게 만들고, 학습이 끝나면 완전히 이산 논리 게이트로 전환함
장점
- 최종 회로가 완전히 이진 논리 게이트로 구성되어, 하드웨어적으로 효율성이 높음
- 이산 로직 기반이므로 해석 가능성과 에너지 효율에 장점이 있음

Differentiable Logic Cellular Automata (DiffLogic CA)

구조
- 2D 격자에서 각 셀이 n비트 상태를 가지며, Perception → Update 단계로 시뮬레이션함
- Perception 단계
  - 이웃 정보(채널별)를 논리 회로 커널로 처리함
- Update 단계
  - 현재 상태와 Perception 결과를 또 다른 논리 회로로 통합해, 다음 시점 상태를 결정함
특징
- 모든 셀이 분산적으로 움직이는 작고 독립된 프로세서처럼 동작함
- 소프트(연속 근사)로 학습 후 하드(이진) 게이트로 추론해 효율성이 높음
- CAM-8과 같은 CA 기반 컴퓨팅 구조와 유사한 철학을 가짐

Experiment 1: Learning Game of Life

목적
- Conway's Game of Life 규칙을 DiffLogic CA로 학습해, 이를 완전히 재현할 수 있는지 확인함
설정
- 셀 상태 1비트 사용
- Perception에 16개 커널(각각 8→4→2→1 게이트 구조)
- Update에 23레이어(초반 16레이어 128노드, 이후 [64, 32, 16, 8, 4, 2, 1])
- 3x3 그리드에서 모든 가능한 상태(512개)를 학습해, 다음 스텝의 정확한 상태를 예측하도록 함
결과
- 학습 손실이 0에 근접하며 Game of Life 로컬 규칙을 완벽히 학습함
- 더 큰 그리드에서 실제 Game of Life처럼 글라이더, 블록 등 모든 패턴을 재현함
- 최종 회로에서 AND·OR 게이트가 많이 사용됨

Experiment 2: Pattern Generation

체커보드(Checkerboard) 예시
- 8비트 상태를 가진 셀이 20스텝 동안 16x16 체커보드를 형성함
- Perception에 16개 커널, Update에 16레이어(최대 256게이트)
- 최종 채널만 타깃 패턴과 비교해 손실 계산
결과
- 정확히 체커보드를 형성하며, 단 몇 개 게이트만으로 규칙이 간결하게 구현됨
- 4배 큰 그리드에서도 동일 규칙으로 스케일 업해 문제없이 동작함
- 일부 셀을 영구적으로 비활성화해도 패턴이 크게 망가지지 않고, 비활성 셀을 복원하면 자동으로 자기 치유함
Asynchronicity
- 비동기 업데이트로 학습해도 체커보드 패턴을 문제없이 학습함
- 동기식으로 학습한 규칙을 비동기 추론에 적용해도 잘 동작함
- 비동기 학습 규칙이 잡음이나 손상 상황에 좀 더 빠르게 복원하는 경향을 보임

Experiment 3: Growing a Lizard

목적
- 20x20 도마뱀 윤곽을 12스텝 만에 형성하도록 학습해, 복잡한 모양 생성 가능성을 확인함
설정
- 128비트 상태
- Perception 4커널(각 [8, 4, 2, 1] 게이트 구조), Update 10레이어(초반 8레이어 512게이트, 이후 [256, 128])
- 그리드 중앙에 하나의 활성 셀을 두고, 주기적 경계 조건 사용
결과
- 큰 그리드(40x40)에서도 정상적으로 도마뱀이 성장함
- 수많은 게이트가 사용되지만, 필요한 하이퍼파라미터 튜닝으로 학습 가능함

Experiment 4: Learning the G with colors

목적
- 3채널 RGB를 포함한 16x16 컬러 이미지를 15스텝에 걸쳐 생성해, 다채널 패턴 생성 검증함
설정
- 64비트 상태(첫 3채널을 RGB로 사용, 각 채널은 0 또는 1)
- Perception 4커널(각 [8, 4, 2]), Update 11레이어(초반 8레이어 512게이트, 이후 [256, 128, 64])
- 타깃 이미지는 8가지 컬러 중 하나씩 채우는 16x16 G 패턴
결과
- 손실 0에 가깝게 학습되며, 15스텝 후 타깃 컬러 G를 정확히 재현함
- 회로는 TRUE·FALSE 게이트가 많이 사용되고 OR 게이트가 두드러짐

Summary and Discussion

무엇을 했는가
- DiffLogic CA라는 완전히 이산적이면서도 학습 가능한 CA 모델을 제안함
- Game of Life처럼 고전 규칙을 복제하고, 체커보드·도마뱀·컬러 G 등의 패턴 생성 능력을 보임
- 이산 로직 회로로 구성되어 직관적 해석과 하드웨어 효율성을 기대할 수 있음
의의
- NCA가 보이는 자기 조직적 패턴을 이산 논리 게이트 기반으로도 학습 가능함을 입증함
- 손상 복원이나 비동기 업데이트 같은 특성을 고려하면, 분산·내결함성(robust) 컴퓨팅에 응용 가능성이 높음
한계 및 향후 과제
- 복잡한 이미지나 패턴 학습 시, 적절한 하이퍼파라미터 튜닝이 필요함
- LSTM형 게이트나 상태를 효율적으로 잊는 구조를 탐색해, 더 풍부한 패턴 형성을 가능하게 할 여지가 있음
- 회로의 규모 최적화, 학습 안정화 등을 개선하는 방향으로 확장 가능함
결론
- DiffLogic CA는 프로그래머블 물질(Programmable Matter) 혹은 Computronium과 같은 이론적 분산 컴퓨팅 방향으로 이어질 수 있는 유망한 접근임
- 완전히 이산적이면서도 학습 가능해, 미래 분산 시스템의 기반이 될 잠재성을 가짐

▲

GN⁺ 4달전 [-]

Hacker News 의견

매우 흥미로움. 나는 새로운 범용 튜링 기계 기판을 수집하고 있음. 유전 프로그래밍 실험을 위해 포켓몬처럼 수집하고 있음. 이전에 셀룰러 오토마타(CA)를 사용해봤지만, 이번 접근이 훨씬 더 매력적임. 커널을 디지털 논리 회로처럼 모델링할 생각은 해본 적이 없었음
- 불리언 논리, 게이트, 회로의 제약이 피트니스 랜드스케이프를 구축하는 흥미로운 결을 만들어냄. 결과 매개변수는 하드웨어 구현으로 직접 변환되거나 추가 최적화 단계를 거쳐 간단한 프로그램으로 컴파일될 수 있음. 수십억 개의 매개변수를 가진 블랙박스의 마법 같은 부동 소수점보다 나아 보임
셀룰러 오토마타를 예술에 활용하는 것을 좋아함. 어떤 패턴이 나타날 수 있는지 놀라움. DLCA를 사용해봐야 할 것 같음
매우 흥미로움. Michael Levin이 동물 세포가 계층 없이 협력할 수 있는 방법에 대해 제기한 질문이 인상적임. 개구리 배아의 눈 세포가 원래 위치로 이동하는 실험이 있음. 세포가 언제 멈춰야 하는지를 아는 방법에 대한 답은 없었음
- 비계층적 조직을 이해하는 것이 사회가 작동하는 방식을 이해하는 데 중요함. 다양한 규모의 죄수의 딜레마를 해결하는 데도 중요함
- 복잡성을 이해하고 모델링하는 것에 대한 것이기도 함
- 처음으로 이러한 것을 모델링할 수 있는 능력을 봄. 많은 방향으로 나아갈 수 있음. 놀라움
최근 "지능"에 대해 많이 생각해왔음. 우리는 지능이 어떻게 작동하는지 이해하는 결정적인 시점에 있는 것 같음. 지능은 고전적인 뉴턴 역학이나 전기와 크게 다르지 않은 자연 발생적 행동임. 결국 간단한 규칙으로 귀결됨
- 뇌의 비이산적인 모든 것이 단지 "인프라"라면? 실제 작업을 수행하는 근본적으로 간단하지만 중요한 핵심 프로세스를 지원하는 것이라면? 모든 것이 논리 게이트와 전기 신호로 귀결된다면?
- 흥미로운 시대가 다가오고 있음
이들은 특히 일반화 능력에 있어 매력적임. 하지만 비전은 무엇인가? 미래에 무엇을 할 수 있을까? 철학적으로, 이것들이 세상에 대해 무엇을 가르쳐줄까? 1D 셀룰러 오토마타가 튜링 등가임을 알고 있음. 따라서 NCA/이것들은 크게 놀랍지 않음
획기적인 발견임. 체커보드나 도마뱀에 관한 것이 아님. Navier-Stokes 미분 방정식은 유체 운동을 지배하는 업데이트 규칙임. 구름 형성과 불꽃의 움직임 등 모든 복잡성이 간단한 법칙에 의해 지배됨. 이 방정식을 실제 샘플을 통해 발견하는 것이 과학임. DLCA 모델을 연기 비디오 녹화에 적용하여 Navier-Stokes 방정식을 유도할 수 있음. 업데이트 규칙 자체가 다른 업데이트 규칙에 따라 변경될 수 있음을 고려하면 흥미로운 영역에 들어갈 것임. 뇌의 뉴런이 수천 개의 뉴런과 연결되어 있는 이유일 수 있음
- Google 임원들은 이 발견을 광고 사업과 관련이 없다고 무시할 것임. 몇 년 후 DLCA가 세상을 뒤집을 때, 그들의 직원이 발견했다고 주장할 것임
매우 흥미로운 논문임. 질문이 있음: "글로벌" 경사 하강법을 사용하여 업데이트되기 때문에 셀 게이트가 진정한 병렬이 아님
- 엄격히 지역적인 가중치 조정 방법에 대한 가능성이 있는가?
불 대수의 연속적 완화는 오래된 아이디어임. 회로 합성은 잘 연구된 분야임. Google이 2년 전에 대회를 우승함. IWLS 대회 데이터 세트에 학습자를 적용해봤는지 궁금함. 그렇지 않다면, 왜 안 했는가?
ARC-AGI 챌린지에 사용할 수 있을까? 최근 것과 결합할 수 있을까?
셀프 플러그이지만 관련 있음 => 다세포 인공 발생의 강건성과 정지 문제 (2011)
- 업데이트 규칙이 퍼셉트론과 등방성 확산으로 결합된 셀룰러 오토마타. 신경망의 가중치는 셀룰러 오토마타가 그림을 그릴 수 있도록 최적화됨. 자기 치유(즉, 방해받았을 때 그림을 재구성함)
- 당시에는 자동 미분이 지금처럼 접근 가능하지 않았음. 진화 전략으로 가중치를 최적화했음. 물론, 경사 하강법을 사용하는 것이 훨씬 나을 것임

답변달기