3P by neo 2023-08-21 | favorite | 댓글과 토론
  • 순수 C/C++로 구현된 Stable Diffusion, 머신러닝 모델에 대한 기사
  • ggml 기반의 구현, llama.cpp와 유사한 작동 방식
  • 16비트 및 32비트 float, 4비트, 5비트, 8비트 정수 양자화 지원
  • 메모리 효율적이며 CPU 추론에 최적화된 구현, txt2img를 사용하여 512x512 이미지 생성 시 약 2.3GB 필요
  • x86 아키텍처에 대한 AVX, AVX2, AVX512 지원
  • 원본 txt2img 및 img2img 모드, stable-diffusion-webui 스타일 토크나이저 포함 구현
  • 사용된 샘플링 방법은 Euler A
  • Linux, Mac OS, Windows 플랫폼과 호환되는 구현
  • 더 많은 샘플링 방법, GPU 지원, 빠른 추론, 메모리 사용량 감소, LoRA 지원, k-quants 지원, 플랫폼 간 재현성 등의 향후 개선 사항
  • 코드 획득, 가중치 변환, 빌드, 구현 실행 방법에 대한 자세한 지침 제공 기사
  • 다양한 출력 모델 형식 지원 구현, 16비트 부동 소수점, 32비트 부동 소수점, 다양한 정수 양자화 포함
  • txt2img 및 img2img 모드에 대한 구현 사용 예시 제공 기사
  • 사용된 정밀도에 따라 메모리 및 디스크 요구 사항이 달라지지만, 512x512 이미지의 경우 메모리 요구량은 약 2.0G에서 2.8G 사이
  • ggml, stable-diffusion, stable-diffusion-webui, k-diffusion 등 여러 참조를 기반으로 한 구현