5P by GN⁺ 1일전 | ★ favorite | 댓글 1개
  • 구글 Nano-banana의 다양한 이미지 생성 및 편집 작업 예시를 모아둔 오픈소스 사례집
  • Google 이미지 생성 기술을 활용해 창의적 변환 및 멀티 이미지 편집 기능을 보여줌
  • 각 케이스는 Twitter/X, Xiaohongshu 등 커뮤니티에서 수집된 실제 활용 사례임
  • 텍스트 프롬프트와 입력 이미지를 조합해 실험적·응용적 변환 예시를 다양하게 제공함
  • 프롬프트 설계 및 입력 가이드를 문서로 정리해 누구나 바로 활용 가능함

개요

  • 이 저장소는 Nano-banana의 이미지 생성 및 편집 기술로 만들어진 다양한 이미지와 프롬프트 예시를 모은 큐레이션 갤러리
  • Google의 무한한 이미지 생성 및 편집 가능성을 보여주면서 Nano-banana의 이해에 도움을 주며, 멀티 이미지 융합과 창의적 편집의 힘을 함께 체험할 수 있음
  • 사례들은 주로 Twitter/X, Xiaohongshu, 기타 셀프미디어 플랫폼에서 수집됨
  • 최신 저장소 업데이트 날짜와 버전 내역을 기록함

메뉴

각 사례는 입력 이미지와 프롬프트 조합, 출력 예시로 구성됨.

입력 & 프롬프트 예시

  • 입력: 참조 이미지, Google Maps 이미지, 인물 사진, 스케치, 소재 이미지 등 여러 타입 필요
  • 프롬프트: 영어로 작성한 이미지 변환, 편집, 디자인, 색보정 등 상세 요청사항 포함

대표 프롬프트 구조

  • 인물 또는 품목의 스타일, 헤어스타일, 배경 변환 등
  • 제품, 건물, 캐릭터, 음식, 만화 스타일, 아이디 사진, 목업 등 다양한 목적 활용 가능
  • [브라켓] 부분은 사용 목적에 따라 수정해서 세밀하게 가이드 가능

예시 흐름

  • 이미지 업로드 → 프롬프트 입력 → 출력 결과 확인(이미지 링크)
  • 일부는 '입력/결과' 테이블 형태, 일부는 출력 결과 단독 제공

케이스 주요 예시 요약

  • 캐릭터/제품 변환: 인물 사진을 캐릭터, 피규어, 레고, Gundam 스타일 패키지로 생성
  • 코스프레/디자인: 일러스트 기반 코스프레 사진, 캐릭터 3면도·표정 시트 생성
  • 이미지 보정/복원: 옛 사진 복원, 투명 배경 제거, 색상·명도 개선, 노이즈 복구
  • 합성/스타일 전환: 만화·흑백 대사 없는 4컷, 만화 스타일 변환, 미니어처, 소재/필터 적용, 헤어스타일/메이크업 변경
  • 데이터 시각화: 블로그/기사 요약 인포그래픽, 칼로리·영양 성분 표시
  • 교육/프레젠테이션: 장기 모형 그림, 수학 문제 풀이, 설명 주석 추가 등

프롬프트 가이드 및 참고

  • 각 프롬프트와 케이스 설명에 입력값 및 [대체내용] 맞춤 가이드 제공
  • 여러 이미지를 조합해 스토리, 패션 보드, 포즈 시트 등 응용
  • 기술적 결과물(와이어프레임, 홀로그램, 3D표현)도 가능

커뮤니티 참여 및 감사

  • AI 커뮤니티 내 실제 사례 공유자가 중심이 되어 자료가 계속 추가되고 있음
  • 새로운 활용 아이디어나 창작물을 자유롭게 제안 가능

프로젝트의 의의 및 차별점

  • 최신 이미지 생성 알고리듬의 실제 응용 예제를 풍부하게 집약해 놓은 GitHub 리포지터리임
  • Nano-banana 프롬프트와 출력 결과의 상세 옵션, 사례별 적용법을 한눈에 볼 수 있음
  • 실무 디자이너, AI 연구자, 개발자 등 누구에게나 높은 참고 가치와 실용성 제공
  • 각각의 예시는 다양한 이미지 편집, 생성, 변환 목적별로 쉽게 재활용 가능함
Hacker News 의견
  • Nano-Banana가 정말 놀라운 결과를 보여줌에 감탄했음. 나는 다양한 텍스트-투-이미지 프롬프트에서 얼마나 정확하게 결과물이 나오는지가 최우선 기준인 최첨단 이미지 모델 비교 웹사이트를 운영 중임. 최근에 기존 이미지를 텍스트로 국소적으로 편집하는 능력을 평가하는 Editing Comparison Showdown도 추가했음. 현재 6개의 멀티모달 모델(Nano-Banana, Kontext Max, Qwen 20b 등)을 비교 중임. 여기 링크에서 결과 확인 가능함. Gemini Flash 2.5는 12점 만점에 7점으로 1등이고, Kontext는 5점인데, 심지어 개발용 모델을 로컬에서 실행할 수 있다는 점을 생각하면 꽤 인상적임
    • 나는 Nano Banana에 정확하게 뭔가 크게 바꾸라고 요청해도 동일한 이미지를 생성하는 경우가 많았음. 간혹 정말 이상하게도 제대로 된 결과가 나오기도 하는데, 이런 현상 겪는 사람 있거나 해결법 아는 사람 있으면 알려주면 좋겠음
    • 여전히 시계(예: 1:15 am이 표시된 시계)는 제대로 표현하지 못함. 또 만화 이미지에 생성되는 텍스트도 100% 정확하지 않음
    • gpt-image-1을 추가하기를 추천함. 글로벌 픽셀을 바꾸는 방식이라 엄밀히 편집 모델은 아니지만, 매우 복잡한 프롬프트와 이미지 참조를 할 때는 Nano Banana보다 더 지시적으로 느껴짐
  • 이 모델은 상상력이 허락하는 한계밖에 제한이 없고, 이미지당 $0.04밖에 안 되는 점이 인상적임. 페이지에 나와있지 않지만, 이건 Google Gemini Image Generation 모델임 (공식 문서). 예제 모음도 좋음. 그런데 두 번째 예제가 업무 환경에서는 다소 부적절한 것 같다는 점이 다소 의아했음
    • Nano Banana는 특히 이미지 편집에 최적화되어 있다는 점을 강조하고 싶음 (더 자세한 정보)
    • 이 모델이 단일 모델인지, 모델 파이프라인인지 궁금함
  • 일부 예제가 NSFW(업무 부적합) 요소가 포함되어 있음. 미국 테크 업계 대부분에서 상단 URL을 공유하는 것은 민감할 수 있으니, 개별 안전한 예제만 골라서 보여주는 게 나을 수 있음. 참고로 사례 1의 절반은 치마를 들고 속옷이 보이게 포즈를 취한 애니·만화풍 메이드 복 여성임. 방문자가 첫 페이지에서 바로 볼 수 있는 예제 중 가장 문제 있는 부분이라 생각함
    • 이 속옷 노출 예제를 생성했다는 점이 정말 놀라웠음. 내가 Nano Banana를 사용했을 땐(세이프티 필터 'off') 저주받은 사무라이 투구와 시체가 누워 있는 만화 스타일 이미지는 생성 거부했음
    • 더 신경 쓰였던 건, 참고 이미지가 명백히 예술가가 만든 고퀄리티 디지털 아트임. AI/LLM 분야에서 법적 문제를 떠나서도, 남의 저작물을 공식 문서에 대놓고 사용하는 건 도의적으로 불편함
  • 사람들이 왜 좋은 결과를 얻고 있는지 진심으로 이해를 못하겠음. 이곳에서 Nano Banana(gemini-2.5-flash-image-preview)를 선택해 사용해봤는데, 결과물이 쓰레기 수준이었음. 캐릭터 참고 사진과 장면을 업로드해서 캐릭터를 해당 장면에 넣어달라고 하면, 단순히 잘라붙이기만 하고 스타일, 색감 다 달라도 그냥 넣어버림. ChatGPT가 차라리 결과물이 더 나음(비슷하게 안 보이는 경우도 있지만 페인트로 2분만에 만드는 것보다는 훨씬 나음). 혹시 내가 잘못된 모델을 사용하고 있는 걸까?
    • 나도 동일한 현상을 겪고 있음. Nano Banana가 잘 작동할 때는 매우 잘 되지만, 90%의 경우 결과물이 이상하거나 질이 낮음. 마치 잘라 붙이기 또는 페인트 오버 같은 느낌이고, 합리적인 요청도 "세이프티"라는 이유로 거절함(경험상 실제 인물이 들어간 이미지는 거의 불가). 인상적이기보단 짜증 남
    • 내 경험상, Nano Banana는 본인이 괜찮겠다 싶으면 정말 카피앤페이스트를 적극적으로 사용함. 캐릭터가 장면에 자연스럽게 통합되어야 한다는 식으로 명확하게 프롬프트해야 함. 즉, 적절하게 프롬프트만 하면 다른 모델보다 훨씬 뛰어난데, 프롬프트 설계 과정 자체가 번거롭고 귀찮음
    • 프롬프트를 조금씩 바꿔보거나, Gemini 2.5 pro로 프롬프트 개선을 요청한 뒤 Gemini 2.5 Flash에 전달하는 식으로 반복하면서 어떤 게 효과적인지 배워가는 게 좋을 듯함
    • 나도 마찬가지로 절대 쓰레기 같은 결과 나옴. 아내(32세) 사진을 업로드해서 앞머리가 있으면 어떨지 시도해보려 했는데, 세이프티 문제로 대부분 거부됨. 가끔 성공해도 완전히 다른 사람 얼굴임. 겨우 한 번 제대로 만들었지만 앞머리 조정은 불가능했고, 계속 같은 결과만 반환하고 중간중간 "콘텐츠 차단"이 많이 떴음
  • 개인적으로 이 모델의 성능은 기대 이하임. 예시 이미지들이 선별적인 것 같음. 내가 해봤던 실패 사례를 공유함: 얼굴에 심한 그림자가 있는 사진에서 그림자를 제거 못함, 오래된 흑백사진을 선명한 컬러(최신 DSLR 스타일)로 요청해도 색감이 흐릿하게만 변함, 헤어스타일 3x3 그리드 요청에 2x3만 반복하다가 겨우 3x3이지만 인종이 섞임, 진짜 이미지와 생성 이미지를 융합시키는 것도 불가능(예: 튜튜 입은 돌고래 이미지는 조악한 복붙 느낌)
    • AR 빌딩 하이라이트 예제가 멋졌음. 똑같은 프롬프트로 스카이라인에서 제일 뚜렷한 건물은 잘 하이라이트하는데, 다른 건물 지목하면 완전히 실패함. 미드타운 맨해튼 이미지에서 Chrysler Building을 찾아 하이라이트해 달랬더니 "이미지에 없음"이라고 하고, 432 Park Ave 요청엔 이미지 중간에 랜덤 빌딩이 생김. 시카고 박물관 캠퍼스 사진에서도 특정 빌딩을 요청하니 안 보이던 Hancock Center를 하이라이트함. 설명도 틀리고, 텍스트도 깨진 경우 있었음
    • 예제들도 완벽하진 않음. "시대별 내 사진" 프롬프트는 "얼굴 바꾸지 말라"는 요청에도 불구하고 완전히 바뀌었고, "OOTD Outfit"은 잘못된 카메라 사용, "Virtual Makeup Try-On"은 메이크업 표현 실패, "Lighting Control"은 조명 제어가 엉망, "Design a Chess Set"은 인풋 이미지가 필요 없다고 했지만 실제로는 필요했던 등 결과물에 물음표가 많았음. 그래도 포토샵 없는 사용자나, 손으로 작업 시작할 초안을 얻는 용도로는 쓸 만함
    • 사실, 어느 프로젝트나 홍보용 데모는 항상 좋은 예시 위주로 뽑히는 게 당연하다고 생각함
  • Python으로 Nano Banana 이미지 생성 쉽게 할 수 있는 패키지를 최근 공개했음(github 링크). 테스트하면서 발견한 인상적인 프롬프트 엔지니어링 트렌드가 있는데, a) LLM 스타일로 마크다운 리스트를 사용하는 방법과 b) "award-winning", "DSLR camera" 같은 기존 AI 이미지 스타일 키워드 활용이 Gemini 2.5 Flash Image에서 매우 효과적임. 이 모델은 텍스트 인코더와 학습 데이터셋이 더 커서, 실제 수식이 어떤 특징을 지녔는지 구분을 잘함. 구글 개발자 문서에도 이런 키워드 사용을 추천하고 있음. 그리고 32k의 문맥 윈도우 덕분에 이미지로 HTML 렌더링하거나 정교한 JSON 입력으로 일관된 결과를 얻는 등 재미있는 시도가 가능함
  • 놀라운 발전이라고 생각함. 불과 얼마 전까지만 해도 같은 캐릭터를 여러 번 일관되게 출력하는 것조차 어렵던 시절이 있었음. 이제는 이런 수준의 조합과 일관성을 보는 중임. 생성형 모델의 발전 속도가 정말 대단함. 수많은 예시를 모아준 제작자와 기여자들에게 감사함. 실제 어떤 도구인지 이해하는 데 큰 도움이 됨
  • 최근 깨달았는데, 예전에는 우리가 상상력을 동원해 헤어스타일 변화 등 머릿속 이미지로 상상할 수 있다는 인간만의 특별함을 믿으며 꽤 즐거웠음. 이제 기계가 그런 능력을 내 상상력과 비슷하거나 그 이상으로 재현하는 걸 보니, 마치 내가 옷걸이 들 힘이 대단하지 않은 만큼 내 상상력도 별것 아닐 수 있단 생각에 약간 불편함
    • 나는 그런 식으로 머릿속에 이미지를 떠올릴 수 없는 타입이라 늘 지적·논리적으로만 생각하는데, 당신의 상상력은 아직도 특별한 능력임. 보통 사람들에겐 진짜 초능력처럼 느껴짐. AI는 배트맨(돈과 유틸리티 벨트 있으면 강력하지만 그것 빼면 무력), 인간 상상력은 슈퍼맨(본래 능력이어서 언제든 꺼낼 수 있음)에 비유하고 싶음
    • 머릿속에 상상한 이미지를 보고 기뻐하고, 웃고, 놀라고, 충격 받을 수 있다는 점이 정말 특별하다고 생각함. 인간은 존재하는 이유와 감정이 있고, 저녁노을을 보며 빛의 산란을 생각해도 되고, 그냥 경이로움을 즐길 수도 있음. 순간순간을 온전히 받아들일 때마다 마법 같은 느낌이 듦. 내가 너에게 답글을 달 수 있고, 해커뉴스가 존재한다는 건 기적 같음
    • 나는 아판타시아(a.k.a 머릿속 영상 상상 불가 증상)가 있는데, 이제 모두가 동일한 조건에서 상상할 수 있게 되어 기쁘게 생각함
    • 향후 기계가 새로운 예술 스타일을 독자적으로 만들어낼 수 있을지 궁금함. 예를 들어, 만화/애니 스타일이 시대에 따라 변화하는데 만약 인간이 그런 진화를 멈춘다면, 기계는 계속 발전시킬 수 있을지 관전포인트임. 원론적으로 가능하겠지만(인간도 생물학적 기계임), 현 AI 구조상 아직 먼 얘기라 생각함
    • 공정하게 보자면, 모델의 이 능력 자체가 우리가 만들어낸 학습 데이터 덕분임
  • Nano Banana 정말 유용하게 사용하고 있음. 내 아들과 친구들 아이들을 위해 사진 기반 컬러링북을 만들 때 활용 중임(예제와 코드). 흑백 컬러링북 느낌을 잘 지키면서, 원본 사진의 디테일도 어느 정도 살아 있는 결과물을 만들어냄
  • 너무 젊은 여성들이 섹슈얼하게 연출된 예제가 많아 불편함을 느낌. Case 1/B는 여성 캐릭터가 치마를 걷어 속옷을 노출하는 장면임. 상당히 인상적인 모델인데 이런 미성숙한 콘텐츠 때문에 PR이 망쳐지는 거 같음. 내가 세어봤을 땐 젊은 여성 26예제, 남성 9예제였음. 참고로 'Lena' 사례만 빠졌음(Lenna 참고)
    • 나도 처음엔 똑같이 불편했음. 서로 다 늙어서 그런 건지 모르겠지만, 그런 느낌이 들었음
    • 기술 발전의 동력이 항상 성적 욕망이었음을 인정함(마음에 안 들어도). VHS, 온라인 결제, 비디오 스트리밍 등도 결국 이런 수요가 이끌었음. "인터넷은 포르노"라는 유명한 노래도 생각남
    • 선사시대 조각가들이 뭘 그리 조각했는지 한번 알아보면 더 놀랄 거임. 사이트 확인 전에 댓글 읽고 케이스 1이 아이였다가 그 다음이 섹시 메이드여서 "아 제발, 이 둘이 한 이미지에 합쳐진 건 아니겠지"라는 걱정이 먼저 들었음.