Stability AI, 연구용도의 디퓨젼 모델 2개 공개
(github.com/Stability-AI)- SD-XL 0.9-base
- 1024x1024 의 이미지에 대해 다양한 ratio로 학습
- 텍스트 인코딩에 OpenCLIP-ViT/G 와 CLIP-ViT/L 을 이용(refiner는 OpenCLIP 모델만 사용)
- SD-XL 0.9-refiner
- 고품질 데이터의 작은 노이즈 레벨을 제거하도록 훈련해서 Text-to-Image 모델로는 동작하지 않음
- Image-to-Image 모델로만 동작