- 같은 프롬프트로 3개의 모델을 주제 정확도, 스타일 정확도, 응집도, 윤리(Ethics) 측면에서 비교
Photography: Humans
- 현재 사진 촬영 분야에서는 미드저니가 선두를 달리고 있지만, 파이어플라이 2가 근소한 차이로 그 뒤
- 덜 양식화되고 자연스러운 헤드샷을 원한다면 앞으로 Firefly 2를 고려하는 것이 좋음
- 사진 용도로는 DALL-E 3를 사용하지 않는 것이 좋음
Photography: Stylistic humans
- 최근엔 스타일리스틱한 사람 이미지를 많이 만들고 있음
- 이러한 프롬프트는 미드저니를 위해 특별히 맞춤화되었기 때문에 약간의 편견이 있을 수 있음
- 하지만 몇 가지 핵심 사항:
- 미드저니는 좀 더 복잡한 프롬프트가 주어질 때 가장 잘 작동하며, 강력한 응집력을 보여줌
- 미드저니는 매체, 구도, 조명의 복잡한 조합을 생성하는 데 탁월
- DALL-E는 유색인종을 위한 조명을 통합하는 데 어려움을 겪어 결과의 정확도가 떨어지는 것으로 보임
- Firefly는 다양성이 명시적으로 요구되지 않을 때 가장 다양한 결과물을 생성
- 보다 창의적인 사진 촬영을 대체할 경우 Firefly와 DALL-E 3 모두 원하는 수준의 품질과 응집력을 달성하는 데 어려움을 겪을 수 있음
Photography: Objects
- 나는 미드저니가 전체적으로 가장 사실적인 오브젝트 응집력을 구현한다고 생각
- Firefly와 DALL-E가 따라잡고 있지만, 이 모델들의 스타일 선호도는 의심할 여지 없이 결과물에 영향을 미칠 것
Illustration
- 일러스트레이션 측면에서 모두 상당한 진전이 있었지만 nuanced한 결과물을 얻으려면 여전히 Midjourney가 최고의 선택
- 하지만 여러 모델을 실험해보고 자신의 고유한 스타일에 맞게 조정하는 것이 좋음
Typography
- 정확한 단어를 생성할 수 있게 된 것은 최근에야 가능
- 수행한 모든 테스트 중에서 DALL-E 3만이 단어를 완전한 개체로 충실하게 렌더링
- 이 특별한 경우의 단어는 "디자인"이었고, 일관성은 모든 실험에서 일관되게 유지
결론
- 환경은 확실히 변화하고 있지만, 제가 강조하는 핵심 사항은:
- Adobe는 사진 분야에서 확실히 격차를 좁히고 있으며 강력한 경쟁자가 되어 가는 중
- DALL-E 3는 타이포그래피를 합리적으로 잘 생성할 수 있는 유일한 제너레이터(Ideogram 제외)
- DALL-E 3는 일러스트레이션 제작에 탁월하며, 단어 생성 기능과 결합하면 규모와 일반화 된 스타일 측면에서 "클립아트용 이미지 생성기"가 될 가능성이 있다고 생각
- 기본 이미지나 다른 활동 중 이미지 생성(ChatGPT를 통한)에는 적합하지만, 곧 고도로 정교한 디자인 도구가 될 것 같지는 않음
- Midjourney는 가장 사실적이고 응집력 있는 사진을 계속 만들어냄.
- 창의적인 제어 기능에 있어서는 Midjourney가 타의 추종을 불허