- 순수 C/C++로 구현된 Stable Diffusion, 머신러닝 모델에 대한 기사
- ggml 기반의 구현, llama.cpp와 유사한 작동 방식
- 16비트 및 32비트 float, 4비트, 5비트, 8비트 정수 양자화 지원
- 메모리 효율적이며 CPU 추론에 최적화된 구현, txt2img를 사용하여 512x512 이미지 생성 시 약 2.3GB 필요
- x86 아키텍처에 대한 AVX, AVX2, AVX512 지원
- 원본 txt2img 및 img2img 모드, stable-diffusion-webui 스타일 토크나이저 포함 구현
- 사용된 샘플링 방법은 Euler A
- Linux, Mac OS, Windows 플랫폼과 호환되는 구현
- 더 많은 샘플링 방법, GPU 지원, 빠른 추론, 메모리 사용량 감소, LoRA 지원, k-quants 지원, 플랫폼 간 재현성 등의 향후 개선 사항
- 코드 획득, 가중치 변환, 빌드, 구현 실행 방법에 대한 자세한 지침 제공 기사
- 다양한 출력 모델 형식 지원 구현, 16비트 부동 소수점, 32비트 부동 소수점, 다양한 정수 양자화 포함
- txt2img 및 img2img 모드에 대한 구현 사용 예시 제공 기사
- 사용된 정밀도에 따라 메모리 및 디스크 요구 사항이 달라지지만, 512x512 이미지의 경우 메모리 요구량은 약 2.0G에서 2.8G 사이
- ggml, stable-diffusion, stable-diffusion-webui, k-diffusion 등 여러 참조를 기반으로 한 구현