C/C++로 구현한 Stable Diffusion

(github.com/leejet)

순수 C/C++로 구현된 Stable Diffusion, 머신러닝 모델에 대한 기사
ggml 기반의 구현, llama.cpp와 유사한 작동 방식
16비트 및 32비트 float, 4비트, 5비트, 8비트 정수 양자화 지원
메모리 효율적이며 CPU 추론에 최적화된 구현, txt2img를 사용하여 512x512 이미지 생성 시 약 2.3GB 필요
x86 아키텍처에 대한 AVX, AVX2, AVX512 지원
원본 txt2img 및 img2img 모드, stable-diffusion-webui 스타일 토크나이저 포함 구현
사용된 샘플링 방법은 Euler A
Linux, Mac OS, Windows 플랫폼과 호환되는 구현
더 많은 샘플링 방법, GPU 지원, 빠른 추론, 메모리 사용량 감소, LoRA 지원, k-quants 지원, 플랫폼 간 재현성 등의 향후 개선 사항
코드 획득, 가중치 변환, 빌드, 구현 실행 방법에 대한 자세한 지침 제공 기사
다양한 출력 모델 형식 지원 구현, 16비트 부동 소수점, 32비트 부동 소수점, 다양한 정수 양자화 포함
txt2img 및 img2img 모드에 대한 구현 사용 예시 제공 기사
사용된 정밀도에 따라 메모리 및 디스크 요구 사항이 달라지지만, 512x512 이미지의 경우 메모리 요구량은 약 2.0G에서 2.8G 사이
ggml, stable-diffusion, stable-diffusion-webui, k-diffusion 등 여러 참조를 기반으로 한 구현