6P by xguru 11달전 | favorite | 댓글과 토론
  • SD-XL 0.9-base
    • 1024x1024 의 이미지에 대해 다양한 ratio로 학습
    • 텍스트 인코딩에 OpenCLIP-ViT/G 와 CLIP-ViT/L 을 이용(refiner는 OpenCLIP 모델만 사용)
  • SD-XL 0.9-refiner
    • 고품질 데이터의 작은 노이즈 레벨을 제거하도록 훈련해서 Text-to-Image 모델로는 동작하지 않음
    • Image-to-Image 모델로만 동작