▲GN⁺ 2024-08-29 | parent | ★ favorite | on: 디퓨전 모델은 실시간 게임 엔진임(gamengen.github.io)Hacker News 의견 Google의 SD 1.4를 사용한 확산 모델이 예상보다 더 많은 원인, 결과, 순서를 포함하고 있음 무한 훈련 데이터를 얻기 위해 에이전트가 Doom을 플레이하게 함 소스 프레임에 가우시안 노이즈를 추가하고 에이전트가 순차 프레임을 '수정'하도록 보상함 모델이 오류 수정 및 안정성을 유지하도록 가르치는 것이 중요함 이 모델을 '사진 실사' 또는 레이 트레이싱 스타일로 미세 조정할 수 있을지 궁금함 이 논문은 실시간 사용자 입력을 받아 출력을 조정하는 시스템을 설명하지 않음 에이전트가 Doom을 플레이한 대규모 데이터 세트로 훈련됨 사용자 입력이 실시간으로 시뮬레이션에 반영되지 않음 논문에서 실시간 사용자 게임 플레이에 대한 설명이 생략됨 이 모델이 20fps로 렌더링할 수 있다는 것이 놀라움 확산 모델과 RNN의 교차점처럼 보임 모델이 많이 플레이한 게임을 꿈꾸는 것과 유사함 인간도 다음 순간을 예측하는 기계일 수 있음 Doom을 모든 것에 실행하려는 시도가 계속됨 이 모델은 가장 높은 하드웨어 요구 사항을 가진 Doom임 하드웨어 사양의 양 끝에 Doom이 위치함 무의미하다고 지적하는 댓글을 읽는 것이 재미있음 모든 것이 이익을 위해 만들어질 필요는 없음 학습 경험, 도전, 호기심을 위해 무언가를 만드는 것도 중요함 즐거움을 느끼는 시간은 결코 낭비가 아님 Doom 시스템 요구 사항과 Stable Diffusion v1 비교 Doom: 4MB RAM, 12MB 디스크 공간 Stable Diffusion v1: 860M UNet 및 CLIP ViT-L/14, 체크포인트 크기 4.27GB, TPU-v5e에서 실행 모델이 게임을 수백 번 기억할 수 있는 용량을 가졌음에도 불구하고 최적화의 여지가 많음 게임을 충분히 자동화하면 게임을 복제할 수 있음 게임 엔진의 역할은 세계를 렌더링하는 것임 "이 문은 파란 키가 필요함"이라는 메시지가 사용자에게 파란 키를 제공하지 않음 게임 엔진은 새로운 게임을 만들고 기존 게임의 규칙을 실시간으로 수정할 수 있음 확산 모델은 게임 엔진이 아님 텍스트 조건이 제공되지 않았지만, 텍스트 프롬프트만으로 새로운 게임을 만드는 것이 가능할 수 있음 RL을 사용하여 Doom의 모양과 작동 방식을 학습함 무한한 상태를 가진 오픈 월드 게임을 시뮬레이션하는 것은 어려울 것임
Hacker News 의견
Google의 SD 1.4를 사용한 확산 모델이 예상보다 더 많은 원인, 결과, 순서를 포함하고 있음
이 논문은 실시간 사용자 입력을 받아 출력을 조정하는 시스템을 설명하지 않음
이 모델이 20fps로 렌더링할 수 있다는 것이 놀라움
Doom을 모든 것에 실행하려는 시도가 계속됨
무의미하다고 지적하는 댓글을 읽는 것이 재미있음
Doom 시스템 요구 사항과 Stable Diffusion v1 비교
게임 엔진의 역할은 세계를 렌더링하는 것임
텍스트 조건이 제공되지 않았지만, 텍스트 프롬프트만으로 새로운 게임을 만드는 것이 가능할 수 있음