소비자 하드웨어에서 실행 가능하고 유연하게 커스터마이징할 수 있는 여러 버전의 모델이 포함되며, 대부분의 사용 사례에 무료로 사용 가능함
Hugging Face에서 Stable Diffusion 3.5 Large와 Stable Diffusion 3.5 Large Turbo 모델을, GitHub에서 추론 코드를 다운로드할 수 있음
릴리스되는 모델들
Stable Diffusion 3.5 Large: 80억 개의 파라미터를 가진 기본 모델로, Stable Diffusion 제품군 중 가장 강력함. 1메가픽셀 해상도에서 전문적인 사용 사례에 이상적임
Stable Diffusion 3.5 Large Turbo: Stable Diffusion 3.5 Large의 증류 버전으로, 4단계만에 훌륭한 프롬프트 준수와 함께 고품질 이미지를 생성함. Stable Diffusion 3.5 Large보다 상당히 빠름
Stable Diffusion 3.5 Medium (10월 29일 출시 예정): 25억 개의 파라미터를 가지고 있으며, 향상된 MMDiT-X 아키텍처와 학습 방법으로 소비자 하드웨어에서 바로 실행되도록 설계됨. 품질과 쉬운 커스터마이징의 균형을 맞춤. 0.25~2메가픽셀 해상도의 이미지 생성 가능
모델 개발 과정
모델 개발 시 유연한 기반을 제공하기 위해 커스터마이징 가능성을 우선시함
이를 위해 Query-Key Normalization을 트랜스포머 블록에 통합하여 모델 학습 과정을 안정화하고 추가 파인튜닝과 개발을 단순화함
다운스트림 유연성을 지원하기 위해 일부 트레이드오프가 필요했음
동일한 프롬프트에서 시드를 달리할 때 출력의 변동성이 커질 수 있음. 이는 기본 모델에서 더 폭넓은 지식 기반과 다양한 스타일을 보존하는 데 도움이 되도록 의도한 것임
그러나 구체성이 부족한 프롬프트는 출력의 불확실성을 증가시킬 수 있으며, 미적 수준이 다를 수 있음
Medium 모델의 경우 아키텍처와 학습 프로토콜을 여러 차례 조정하여 품질, 일관성, 다중 해상도 생성 능력을 향상시킴
Stable Diffusion 3.5의 장점
커스터마이징 용이성: 특정 창작 니즈에 맞게 모델을 쉽게 파인튜닝하거나, 맞춤형 워크플로우 기반 애플리케이션 구축 가능
효율적인 성능: 특히 Stable Diffusion 3.5 Medium과 Stable Diffusion 3.5 Large Turbo 모델은 표준 소비자 하드웨어에서 무거운 요구 사항 없이 최적화되어 실행됨
다양한 출력: 광범위한 프롬프팅 없이도 다양한 피부색과 특징을 가진 전 세계 사람들을 대표하는 이미지 생성 가능
Stable Diffusion 3.5 Large는 프롬프트 준수에서 시장을 선도하고 이미지 품질에서 훨씬 더 큰 모델과 견줄 만함
Stable Diffusion 3.5 Large Turbo는 크기 대비 가장 빠른 추론 시간을 제공하면서도 이미지 품질과 프롬프트 준수에서 매우 경쟁력 있음
Stable Diffusion 3.5 Medium은 다른 중간 크기 모델을 능가하며, 프롬프트 준수와 이미지 품질의 균형을 맞춰 효율적이고 고품질의 성능을 제공함
Stability AI Community License 개요
비상업적 사용에는 무료: 개인과 조직은 과학 연구를 포함해 비상업적 용도로 무료 사용 가능
연 매출 100만 달러 이하 상업적 사용에는 무료: 스타트업, 중소기업, 창작자는 연 매출 100만 달러 미만인 경우 상업적 용도로 무료 사용 가능
출력물의 소유권: 제한적인 라이선싱 의미 없이 생성된 미디어의 소유권 보유 가능
연 매출 100만 달러 이상인 조직은 Stability AI에 연락하여 엔터프라이즈 라이선스 문의 가능
모델 액세스 방법
모델 가중치는 현재 Hugging Face에서 셀프 호스팅용으로 사용 가능
Stability AI API, Replicate, ComfyUI, DeepInfra 등의 플랫폼을 통해서도 모델 액세스 가능
안전성에 대한 Stability AI의 의지
Stability AI는 안전하고 책임감 있는 AI 관행을 믿으며, 개발 초기 단계부터 성실성을 보장하기 위한 의도적인 조치를 취함
악의적 행위자에 의한 Stable Diffusion 3.5의 오용을 방지하기 위해 합당한 조치를 취하고 있음
향후 계획
10월 29일 Stable Diffusion 3.5 Medium 공개 출시 예정
곧이어 다양한 전문 사용 사례를 위한 고급 제어 기능을 제공하는 ControlNets 출시 예정