19P by xguru 2023-10-30 | favorite | 댓글 2개
  • 같은 프롬프트로 3개의 모델을 주제 정확도, 스타일 정확도, 응집도, 윤리(Ethics) 측면에서 비교

Photography: Humans

  • 현재 사진 촬영 분야에서는 미드저니가 선두를 달리고 있지만, 파이어플라이 2가 근소한 차이로 그 뒤
  • 덜 양식화되고 자연스러운 헤드샷을 원한다면 앞으로 Firefly 2를 고려하는 것이 좋음
  • 사진 용도로는 DALL-E 3를 사용하지 않는 것이 좋음

Photography: Stylistic humans

  • 최근엔 스타일리스틱한 사람 이미지를 많이 만들고 있음
  • 이러한 프롬프트는 미드저니를 위해 특별히 맞춤화되었기 때문에 약간의 편견이 있을 수 있음
  • 하지만 몇 가지 핵심 사항:
    • 미드저니는 좀 더 복잡한 프롬프트가 주어질 때 가장 잘 작동하며, 강력한 응집력을 보여줌
    • 미드저니는 매체, 구도, 조명의 복잡한 조합을 생성하는 데 탁월
    • DALL-E는 유색인종을 위한 조명을 통합하는 데 어려움을 겪어 결과의 정확도가 떨어지는 것으로 보임
    • Firefly는 다양성이 명시적으로 요구되지 않을 때 가장 다양한 결과물을 생성
    • 보다 창의적인 사진 촬영을 대체할 경우 Firefly와 DALL-E 3 모두 원하는 수준의 품질과 응집력을 달성하는 데 어려움을 겪을 수 있음

Photography: Objects

  • 나는 미드저니가 전체적으로 가장 사실적인 오브젝트 응집력을 구현한다고 생각
  • Firefly와 DALL-E가 따라잡고 있지만, 이 모델들의 스타일 선호도는 의심할 여지 없이 결과물에 영향을 미칠 것

Illustration

  • 일러스트레이션 측면에서 모두 상당한 진전이 있었지만 nuanced한 결과물을 얻으려면 여전히 Midjourney가 최고의 선택
  • 하지만 여러 모델을 실험해보고 자신의 고유한 스타일에 맞게 조정하는 것이 좋음

Typography

  • 정확한 단어를 생성할 수 있게 된 것은 최근에야 가능
  • 수행한 모든 테스트 중에서 DALL-E 3만이 단어를 완전한 개체로 충실하게 렌더링
  • 이 특별한 경우의 단어는 "디자인"이었고, 일관성은 모든 실험에서 일관되게 유지

결론

  • 환경은 확실히 변화하고 있지만, 제가 강조하는 핵심 사항은:
  • Adobe는 사진 분야에서 확실히 격차를 좁히고 있으며 강력한 경쟁자가 되어 가는 중
  • DALL-E 3는 타이포그래피를 합리적으로 잘 생성할 수 있는 유일한 제너레이터(Ideogram 제외)
    • DALL-E 3는 일러스트레이션 제작에 탁월하며, 단어 생성 기능과 결합하면 규모와 일반화 된 스타일 측면에서 "클립아트용 이미지 생성기"가 될 가능성이 있다고 생각
    • 기본 이미지나 다른 활동 중 이미지 생성(ChatGPT를 통한)에는 적합하지만, 곧 고도로 정교한 디자인 도구가 될 것 같지는 않음
  • Midjourney는 가장 사실적이고 응집력 있는 사진을 계속 만들어냄.
    • 창의적인 제어 기능에 있어서는 Midjourney가 타의 추종을 불허

StableDiffusion 은 왜 뺏죠?
미드저니 때문인가

DALL-E 3 써봤을 때 글자를 명확하게 표현하는 게 너무 신기했어요.
하지만 아직 품질은 미드저니가 최고인가 보는군요.