GN⁺: 이미지 생성 모델 FLUX는 빠르고 오픈 소스입니다
(replicate.com)- FLUX는 Replicate에서 더 빠르게 작동하며, 최적화된 코드를 오픈 소스로 공개하여 누구나 이를 확인하고 개선할 수 있음
- 속도 향상의 비결
- FLUX 모델은 Black Forest Labs와 협력하여 관리하며, 두 가지 주요 최적화 작업을 수행함
- 모델 최적화:
torch.compile
과 CuDNN 주의 커널을 사용하여 성능을 향상시킴 - 새로운 동기 HTTP API 추가로 이미지 모델의 속도를 크게 개선함
- 모델 최적화:
- flux-fp8-api의 양자화는 출력에 약간의 변화를 주지만 품질에 큰 영향을 미치지 않음
- 최적화 방법을 투명하게 공개하며, 사용자가 최적화를 비활성화할 수 있도록 함
- FLUX 모델은 Black Forest Labs와 협력하여 관리하며, 두 가지 주요 최적화 작업을 수행함
-
오픈 소스의 속도
- 오픈 소스 모델은 기본적으로 느린 경우가 많으며, 모델 제공자들이 이를 최적화하여 독점 API로 제공하는 경우가 많음
- FLUX의 모든 개선 사항을 오픈 소스로 공개하여 커뮤니티와 협력하여 더욱 빠른 모델을 개발하고자 함
-
FLUX의 활용
- Replicate에서 FLUX를 실행하는 것 외에도 다양한 활용 가능
- 사용자 데이터로 FLUX를 미세 조정 가능
- 코드를 수정하여 맞춤형 버전 배포 가능
- 새로운 플레이그라운드에서 모델을 시도하고 출력 비교 가능
- Replicate에서 FLUX를 실행하는 것 외에도 다양한 활용 가능
GN⁺의 정리
- FLUX는 Replicate에서의 성능 향상과 오픈 소스화를 통해 누구나 최적화된 모델을 활용할 수 있는 기회를 제공함
- 오픈 소스의 속도 문제를 해결하고자 하는 노력은 커뮤니티와의 협력을 통해 더욱 빠른 모델 개발을 가능하게 함
- FLUX의 다양한 활용 가능성은 사용자에게 맞춤형 솔루션을 제공할 수 있는 기회를 제공함
- 유사한 기능을 가진 다른 프로젝트로는 TensorFlow와 PyTorch가 있음
Hacker News 의견
-
텍스트에서 이미지로 변환하는 모델이 비효율적이라고 느끼며, 이를 여러 단계로 나누어 처리하는 것이 더 나을 것이라는 의견이 있음. 각 단계가 독립적으로 훈련될 수 있어 모듈화가 가능하고, 이미지 편집이 더 쉬워질 것이라고 생각함
- 예를 들어, "객체 x가 객체 y 옆에 있고, 그 위에 텍스트 foo가 있는" 이미지를 생성하는 것이 더 쉬워질 것이라고 설명함
- 최종 렌더링 모델이 프롬프트와 별개로 존재하여 예술 스타일이나 사실성 수준을 조정할 수 있을 것이라고 언급함
-
비상업적 소프트웨어는 오픈 소스가 아님을 강조하며, 원 저작자가 유지보수를 중단하면 다른 사람이 계속할 수 없거나 무료로 일해야 한다고 설명함
- 오픈 소스는 원 저작자가 작업을 중단했을 때 모든 사람이 개발을 계속할 수 있는 라이선스를 제공함
- FLUX.1 [schnell]만 오픈 소스(Apache2)이며, FLUX.1 [dev]는 비상업적임
-
FLUX.schnell을 쉽게 사용하려면 Pollinations URL에 프롬프트를 입력하라고 제안함
- FLUX의 속도가 놀랍다고 언급하며, 세 개의 L40S GPU만으로 30분마다 8000개의 이미지를 생성한다고 설명함
-
FLUX를 사용하여 Substack에 사용할 흰색 배경의 이미지를 생성하는 것을 좋아한다고 함
- 텍스트와 함께 시각적으로 무언가를 전달할 수 있어 좋다고 설명함
-
FLUX가 로컬 호스팅 생성 시스템 중 프롬프트 준수 측면에서 선두주자이지만, 얕은 심도가 항상 나타나는 것이 불편하다고 언급함
-
Midjourney 구독을 취소했으며, Replicate와 Ideogram을 고려 중이라고 밝힘
-
FLUX 1.1의 훈련 데이터에 대해 궁금해하며, 생성된 이미지가 개인적인 사진처럼 보인다고 설명함
- 훈련 데이터가 공개된 Facebook 게시물, Snapchat, Vkontakte 등에서 가져온 것인지 의문을 제기함
-
FLUX 1.1 pro 모델이 이전 오픈 모델과 크게 다른 훈련 데이터를 사용하지 않았을 것이라고 생각함
-
FLUX의 비교 페이지를 언급하며, 속도 버전이 원래 모델과 완전히 다른 이미지를 보여준다고 설명함
-
Meta의 모델에 대한 오픈 소스 논란을 언급하며, FLUX의 경우 FLUX schnell만 오픈 소스라고 설명함
- Meta의 Llama 모델이 더 관대한 라이선스를 가지고 있으며, FLUX schnell보다 조정하기 쉽다고 언급함
-
오픈 소스 커뮤니티가 OpenFLUX와 같은 프로젝트를 지지해야 한다고 주장함
-
손이 여전히 이상하게 보이는 문제를 해결하지 못한 것에 대해 의문을 제기함