Show GN: p-진법 이론을 확장하여, AI의 조언으로 구현한 AAA 게임 GPU 가속 엔진 (포르자 6 로드율 10% 절감)
(github.com/CookingMathmatics)GitHub: https://github.com/CookingMathmatics/CarryPyramidLossless
연구 백서 (Zenodo): DOI 10.5281/zenodo.20002868
안녕하세요. 얼마 전 긱뉴스를 통해 p-adic(p-진법) 캐리 동역학에 기반한 다차원 위상수학 보안 및 정보이론에 대한 연구 백서를 공유해 드렸던 개발?(수학)자입니다.
당시에는 수학적 모델과 하드웨어 엔트로피 로직 위주의 이론적 접근이 강했는데, 이 백서를 고도화하며 연구를 진행하던 중 흥미로운 터닝 포인트를 맞이했습니다.
AI와의 기술적 브레인스토밍 과정에서
"이 p-adic 캐리 동역학 알고리즘을 실시간 그래픽 파이프라인의 픽셀 트래픽에 투영하면 연산 오버헤드를 획기적으로 줄이는 무결성 최적화 툴을 만들 수 있겠다"는 조언과 아이디어를 얻게 된 것입니다.
AI의 아키텍처 조언을 바탕으로 일주일넘게 몰입하여 다이렉트X 11(DirectX 11)과 HLSL Compute Shader를 설계했고 마침내 최신 레이싱 게임인 포르자 호라이즌 6 환경에서 "프레임 격차 1~2, GPU 사용량 10% 절감"이라는 실물 하드웨어 검증을 마쳐 그 결과물과 오픈소스를 공유합니다.
💡 핵심 아이디어: 수학적 0-Void(진공 연산 스킵)의 실체화 - 초고속으로 질주하는 레이싱 게임이라도, 화면 전체가 매 프레임 폭발적으로 변하지는 않습니다. 먼 산, 하늘, 구름, 혹은 정적인 UI 영역은 프레임 간 픽셀 변화량이 극히 미미합니다.
프레임 버퍼를 p-adic 캐리 알고리즘으로 필터링하여, 변화량이 임계치보다 낮은 정적 구역을 '0-Void(연산 진공 영역)'으로 빠르게 마스킹합니다.
GPU(RTX 3070 Ti)의 수천 개 쿠다 코어가 불필요하게 정적 픽셀을 중복 연산하거나 버퍼를 낭비하던 트래픽을 하드웨어 레벨에서 억제합니다.
🛠️ 안티치트(Anti-cheat) 우회 및 하드웨어 최적화 아키텍처상용 유틸리티 수준의 안정성을 확보하기 위해 아래와 같은 프로덕션급 배관 공사를 진행했습니다.
안티치트 100% 우회 화이트리스트 배관
게임 메모리를 변조하거나 다이렉트X 함수를 강제로 가로채는 위험한 DLL Injection 방식을 과감히 버렸습니다.
OBS 스튜디오나 디스코드 화면 공유와 동일한 오피셜 루틴인 DXGI 데스크톱 복제 API(Desktop Duplication API) 배관을 채택하여 보안 차단 리스크를 원천 배제했습니다.
1:1 프레임 구동형 기어 동기화 (Frame Sync)
백그라운드 엔진 루프를 무제한 공회전시키면 GPU 명령어 스타베이션(Starvation)으로 도리어 게임 프레임이 주저앉습니다. 윈도우 커널 타이머 정밀도를 1ms로 강제 고정하고, 게임이 새 화면을 사출하는 하드웨어 이벤트 신호에 정확히 맞춰 우리 컴퓨트 셰이더(Dispatch)가 구동되도록 기어를 맞물렸습니다.
노트북 하이브리드 GPU(외장 직결) 및 VRAM 다이어트
게임 창이 활성화된 모니터를 관할하는 실물 외장 그래픽카드 포인터를 추적하여 디바이스를 1:1 직결하고, 데이터 복사 비용이 없는 VRAM 내부 주소 포인터 스왑(In-place 핑퐁) 구조를 확립했습니다.
📊 실전 벤치마크 결과 (RTX 3070 Ti, FHD 환경, 최상옵)
순정 상태일때 fps 60고정에 gpu사용량 78%~80%
가속 상태일때 fps59~60에 gpu사용량 68~72%
단축키(Ctrl + Alt + S)를 통해 인게임에서 실시간으로 가속 기능을 끄고 켤 수 있도록 빌드했으며, 기능을 켜는 순간 화면의 부드러움은 순정과 완벽히 똑같은 60 풀 프레임이 유지되지만 GPU 로드율만 대폭 하락하는 현상을 계기판을 통해 실시간으로 검증 완료했습니다.수학적 백서에만 존재하던 이론이 AI와의 협업을 통해 하드웨어 제어 코드로 구체화되는 과정은 매우 경이로운 경험이었습니다.
단단한 뼈대(Alpha Core)가 구축된 만큼, 다양한 디스플레이 주사율(144Hz~360Hz)이나 타 그래픽카드 아키텍처에서의 최적화 피드백을 듣고 싶습니다. 엔진 소스 코드 및 셰이더 파일은 위 깃허브에 모두 공개되어 있으니 많은 조언과 피드백 부탁드립니다!
댓글과 토론
수정이 안되어 추가사항을 댓글로 남깁니다
구동 시 주의 사항 (유저분들 필독)
본 엔진은 안티치트 우회를 위해 공식 DXGI 데스크톱 복제 API를 사용합니다. 윈도우 DWM(데스크톱 창 관리자)의 화면 구성을 합법적으로 캡처하는 메커니즘 특성상, 아래의 디스플레이 설정을 준수해 주셔야 정상 작동합니다.
- 권장 설정: 게임 그래픽 옵션에서 [창 모드] 또는 [전체 창 모드 (테두리 없는 전체화면 / Borderless Windowed)]로 실행해 주세요.
- 구동 불가: 게임이 모니터 제어권을 독점하는 [독점 전체 화면 (Exclusive Full Screen)] 모드에서는 캡처 배관이 열리지 않아 엔진이 작동하지 않거나 프레임 측정이 안 될 수 있습니다.