1P by GN⁺ | ★ favorite | 댓글 1개
  • Google DeepMind의 Gemini Image 계열에 추가된 Nano Banana 2 Lite는 이미지 생성·편집을 더 빠르고 저렴하게 돌리려는 모델로, 반복이 많은 시각 작업의 비용 부담을 낮추는 데 초점을 둠
  • 핵심 축은 낮은 지연시간과 대규모 비용 효율이며, 무거운 프로덕션 모델보다 낮은 비용으로 수천 장의 이미지를 생성할 수 있음
  • 품질 면에서는 Nano Banana 계열의 제어력과 정확도를 유지하면서 캐릭터 일관성, 정밀 편집, 실제 세계 지식 활용을 지원함
  • Space Lift, Gridscape, Peek-A-Word, Anywhere 같은 사례는 이미지 생성이 앱 흐름을 끊지 않을 만큼 빨라질 때 가능한 사용자 경험을 보여줌
  • 작은 얼굴, 정확한 철자, 세부 묘사, 데이터 기반 결과, 번역·현지화, 복잡한 편집과 합성에서는 오류가 날 수 있어 생성 결과 검토가 필요함

빠른 생성과 낮은 비용을 앞세운 Gemini Image 모델

  • Nano Banana 2 Lite는 Google DeepMind가 공개한 Gemini Image 모델로, 빠른 이미지 생성·편집과 낮은 비용을 목표로 함
  • 주요 사용자는 크리에이터, 비즈니스, 개발자이며, 여러 시각적 아이디어를 빠르게 탐색하는 워크플로에 맞춰짐
  • Google DeepMind는 이 모델을 지금까지 가장 빠르고 효율적인 Gemini Image 모델로 소개하며, 가장 낮은 비용으로 고속 생성과 편집을 제공한다고 밝힘
  • 접근 경로는 다음과 같음

속도, 비용, 품질의 균형

  • 지연시간 단축이 핵심으로, 빠른 탐색과 반복 작업을 지원함
  • 대규모 생성에서는 더 무거운 프로덕션 모델보다 훨씬 낮은 비용으로 수천 장의 이미지를 만들 수 있음
  • 품질은 Nano Banana에서 기대하는 제어력과 정확도를 더 빠르게 제공하는 방향임
    • 캐릭터 일관성 유지
    • 정밀한 시각 편집
    • 실제 세계 지식 활용
  • 프롬프트에는 캐릭터, 배경, 전체 분위기 등 원하는 요소를 자세히 적을수록 의도한 이미지에 가까워질 수 있음
  • 프롬프트 가이드는 View prompt guideLearn how to prompt에서 제공됨

이미지 생성 속도를 전제로 한 앱 사례

  • Space Lift는 방 사진을 업로드하면 Mid-Century Modern부터 Bohemian Chic까지 다양한 인테리어 콘셉트를 즉시 생성하는 앱임
  • Gridscape는 무한 캔버스에서 질문을 입력하면 Nano Banana 2 Lite와 Gemini 3.1 Flash Lite가 만든 텍스트·이미지로 정보 노드를 구성함
    • 사용자는 클릭 가능한 경로를 따라 관련 개념을 더 깊게 탐색할 수 있음
  • Peek-A-Word는 선택한 텍스트를 AI 생성 시각 자료로 바꾸고, 간결한 정의와 문맥 이미지를 한 공간에서 제공함
    • 탭 전환 없이 학습 흐름을 유지하는 데 초점을 둠
  • Anywhere는 Nano Banana 2 Lite로 만든 인터랙티브 3D 지구본 앱임
    • 이미지를 첨부하면 세계 명소를 배경으로 개인화된 엽서 시리즈를 생성함
    • 사용자는 지구본을 돌리고 사진을 클릭해 가상 여행지 정보를 볼 수 있음

비교 지표와 모델 카드

  • Google DeepMind는 Nano Banana 2 Lite를 지금까지 가장 효율적인 모델로 소개하며, 품질과 속도의 균형이 좋다고 밝힘
  • 비교 대상에는 프리미어 모델인 Nano Banana 2가 포함됨
  • 비교 영역은 프롬프트 준수, 세부 표현, 제어력 등 이미지 생성 품질 요소를 포함함
  • 성능 섹션은 다음 지표를 제시함
    • Image Editing: lmarena.ai 기준 경쟁 모델 대비 이미지 편집 Elo 점수
    • Image Generation: lmarena.ai 기준 경쟁 모델 대비 이미지 생성 Elo 점수
    • Latency per 1k resolution image: artificialanalysis.ai 데이터 기반 1k 해상도 이미지당 지연시간
    • Price per 1k resolution image: 1k 해상도 이미지당 가격
  • 모델 카드는 View model card에서 제공됨

파트너들이 본 활용 가능성

  • Figma Weave는 Nano Banana 2 Lite가 노드 기반 캔버스에서 디자이너가 더 많은 아이디어를 탐색하고 독특한 이미지를 만드는 데 도움이 된다고 평가함
  • Manus AI는 자율 워크플로 안에서 슬라이드 덱과 웹 페이지용 실시간 이미지 생성을 테스트함
    • 속도는 AI 에이전트의 빠른 시각 반복과 수초 내 결과 제공에 적합하다고 평가함
    • 이미지 품질은 전체 Nano Banana 2에 가깝다고 봄
  • Artlist는 생성 속도가 상상보다 빨라지면 사용자가 도구를 기다리지 않고 아이디어 안에 머물 수 있다고 평가함
  • Weekend는 음성 제어 TV 게임 Wit’s End에서 instant-ramen이 Gemini 3.1 Flash Image보다 1k 이미지 생성 기준 약 2.7× 빠르다고 밝힘
    • 텍스트-이미지, 편집, 다중 이미지 합성을 하나의 드롭인 API로 처리함
  • Latitude는 플레이어가 탐험하는 동안 세계를 생성하는 엔진에서 이미지 생성 속도가 중요하며, instant-ramen이 플레이 경험을 따라갈 만큼 빠른 시각 생성을 가능하게 한다고 평가함

아직 검토가 필요한 한계

  • Gemini는 다양한 이미지를 만들 수 있지만 일부 기능은 아직 개선 중이며, 생성 이미지는 직접 확인해야 함
  • 시각·텍스트 충실도에서는 작은 얼굴, 정확한 철자, 이미지의 세부 묘사에서 어려움이 있을 수 있음
  • 데이터와 사실 정확도에서는 현실 세계 지식이 광범위하지만 완전하지 않음
    • 인포그래픽 생성, 다이어그램 주석, 복잡한 데이터 표현에서 정보를 잘못 해석하거나 사실과 다른 결과를 만들 수 있음
    • 데이터 기반 출력은 검증이 필요함
  • 번역과 현지화에서는 여러 언어의 텍스트 생성과 번역이 가능하지만, 문법, 철자, 문화적 뉘앙스, 관용 표현에서 어려움이 있을 수 있음
  • 복잡한 편집과 이미지 블렌딩에서는 마스크 편집, 낮을 밤으로 바꾸는 큰 조명 변경, 여러 이미지 합성에서 부자연스러운 결과나 시각적 아티팩트, 단절된 장면이 나올 수 있음
  • 캐릭터 일관성은 강점이지만 항상 정확하지는 않으며, Google DeepMind는 이를 더 안정적으로 만들기 위해 개선 중임

안전 기능과 사용상 주의

  • Google DeepMind는 데이터셋의 유해 콘텐츠를 줄이고 유해 출력 가능성을 낮추기 위해 광범위한 필터링과 데이터 라벨링을 사용함
  • 콘텐츠 안전성에서는 아동 안전과 표현을 포함해 레드팀과 평가를 수행함
  • 생성 이미지에는 최신 개인정보 보호·안전 기능이 포함되며, SynthID가 AI 생성 이미지를 식별할 수 있도록 보이지 않는 디지털 워터마크를 이미지에 직접 삽입함
  • SynthID 정보는 Learn more에서 제공됨
  • Gemini 3.1 Flash-Lite Image 같은 LLM은 Google의 견해를 대표하지 않는 부정확하거나 불쾌한 콘텐츠를 제공할 수 있음
  • LLM이 제공한 콘텐츠를 신뢰하거나 게시하거나 사용할 때는 주의가 필요하며, 의료·법률·금융 등 전문 조언에는 의존하면 안 됨

댓글과 토론

Hacker News 의견들
  • 집 인테리어 생성 첫 예시는 형언하기 어려울 정도로 싫음. 요즘 부동산 중개인들이 낡고 안 팔리는 아파트를 전부 AI 필터에 넣어 돌려서, 실제로 어떤 끔찍한 물건을 터무니없는 가격에 팔려는지 보기 전에 “이케아풍으로 꾸미면 이렇게 보일 수도 있다”는 이미지 수십 장을 먼저 넘겨야 함

    • 이런 건 불법적인 허위 표시로 봐야 한다고 생각함. AI 사용에는 회색지대가 너무 많음
    • 거의 사기에 가깝다고 봄. Streeteasy에서 어떤 아파트는 책상, 서랍장, 퀸 침대를 모두 ‘넣은’ 것처럼 보였는데, 이미지 모델이 현실에는 존재하지 않는 비율로 가구를 그냥 축소한 게 뻔했음
      실제 침실에는 퀸 침대 하나만 겨우 들어갈 수 있었음 ;(
    • 아파트 실제 모습 자체를 속이는 건 사회적으로든 법적으로든 받아들일 수 없어야 한다는 데 100% 동의함. 다만 내 욕실 리모델링에서 이미지 모델은 디자인 선택에 꽤 도움이 됐음
      특히 어떤 부분에 타일을 붙였을 때 전체 공간이 어떻게 보일지 직접 상상하기 어려운 경우에 유용했음
    • 내가 사는 NYC에서는 그런 보정 이미지를 올리는 게 10년도 넘게 일반적이었음
      예전에는 그런 작업을 해줄 사람을 고용하는 비용이 더 비쌌을 뿐임
      보정된 이미지는 늘 똑같이 밝은 벽과 회색 잡지풍 가구를 보여줌
      AI가 더 싸게 만들었을 뿐, 결국 이렇게 될 수밖에 없었음
      이런 식으로 보정된 이미지는 보정 사실을 알리는 작은 워터마크가 붙어 있긴 함
    • 좋은 사진가만 있어도 효과가 엄청남. 친구가 집을 팔 때 매물 사진에서 집이 얼마나 좋아 보이는지, 또 내가 작지 않다는 걸 아는데도 얼마나 커 보이는지 보고 놀랐음
      AI 필터가 나오기 전에도 있던 문제라 새롭지는 않지만, 지금은 훨씬 더 심해지고 비용도 낮아졌음
  • 이 모델을 테스트할 수 있는 조기 접근 권한을 받았음. 업무를 통해서였고, Google이 개인적으로 나를 좋아하게 된 건 여전히 아님 lol
    여기서 광고한 대로 동작하고, 좋은 텍스트 렌더링 같은 요소에서는 Nano Banana 2를 증류한 버전처럼 보임. Nano Banana 1은 이 부분이 훨씬 약함
    물론 세밀한 프롬프트에서는 기본 Nano Banana 2 수준은 전혀 아님. 가장 큰 불만은 NB2에서는 프로그래밍으로 화면비를 강제할 수 있는데 NB2L에서는 안 된다는 점임
    다만 이미지당 $0.034라는 가격은 예상보다 높음. 보통 가격은 생성 시간과 연관되는데, Nano Banana 1보다 절반 시간에 생성하면서도 Nano Banana 1은 이미지당 $0.039임
    NB1 파이프라인을 NB2L로 바로 대체할 수 있다는 Google의 주장은 타당함
    어제 Google은 Gemini 앱에서 무료 이미지 생성을 허용한다고 발표했지만(https://blog.google/innovation-and-ai/products/gemini-app/pe...), 어떤 모델을 쓰는지는 명시하지 않았음. Nano Banana 2 Lite의 주된 동기가 여기에 있다고 봄

    • Vertex를 통해 NB2 Lite에서도 프로그래밍으로 화면비를 설정할 수 있음 [1]. GenAI Showdown용 이미지를 만들 때 쓰는 프로그램을 업데이트해서 모델 ID를 gemini-3.1-flash-lite-image로 바꿨고, 16:9, 4:3 같은 화면비를 사용할 수 있었음
      [1] - https://cloud.google.com/developers/vertex-ai
    • 어떤 업무를 하길래 자동 이미지 생성을 대규모로 해야 하는지 궁금함
  • 괜찮긴 한데 Google의 망가진 AI Studio 위에 있음. 거기 기능 절반은 Google One 계정이 필요해서 못 씀
    나는 Workspace 계정이라 자격이 안 되고, 전환도 못 함. Google One은 자체 도메인을 지원하지 않기 때문임
    그럼 멋진 이메일 주소와 Banana를 둘 다 쓰려면 계정 두 개를 운영하고 비용까지 내야 하나? 여기서 맞는 유료 Google 계정 수는 0개라는 생각이 들기 시작함

    • 비슷한 상황이었음. Google은 모델 사용과 결제 사용자 경험을 정말 개선해야 함
      내 해결책은 OpenRouter였음. 개발·테스트용 채팅에서 Google 모델로 이미지를 생성할 수 있고, 같은 프롬프트를 다른 모델들과 나란히 실행해 볼 수도 있음. 가벼운 이미지 생성에는 아주 편리함
    • 나도 거의 같은 처지임. 개인용으로 One과 Workspace를 둘 다 내고 있는데, 이런 기능에 어느 쪽을 써야 할지 애매함
      대체로 더 많은 맥락이 있는 개인 계정을 기본으로 쓰지만, 그러면 Workspace Drive 같은 자료를 가져오는 데 몇 단계가 더 필요함
      그리고 Project Genie 같은 건 Workspace에서 아예 사용할 수 없는데, 꽤 이상하게 느껴짐
    • 약간 노골적인 홍보지만, burlap은 Gemini Studio나 OpenAI의 키를 넣어서 웹 인터페이스를 건드리지 않고 이것저것 시험해 볼 수 있게 해줌. 그래서 만들었음
      https://www.burlap.app/download
  • 속도는 확실히 인상적임. 기본 NB2는 이미지당 약 30초인데, 이건 5초 미만으로 보임
    아이들을 등장인물로 넣어 삽화가 있는 이야기를 만들어 주는 앱을 만들었음. 삽화 스타일은 유지하면서도 아이들의 닮은꼴을 우선하고 싶었음
    여러 모델을 테스트했지만, 스타일화한 상태에서 닮은꼴을 유지하는 데 이만큼 가까운 모델은 없어 보임. 다른 모델들은 흔한 캐릭터처럼 만들어 버림
    사용자가 최대한 빨리 “아하” 순간을 느끼게 하고 싶어서 앱 온보딩에 이 모델을 넣는 게 기대됨. 30초 이상 기다리는 건 이상적이지 않음
    다만 실제 삽화에는 여전히 기본 NB2를 쓸 예정임. 이 Lite 버전은 다른 사람들이 말한 것처럼 뉘앙스와 일관성에서 아직 약간 문제가 있음

    • 비슷한 걸 시도했는데, 어린이와 관련된 건 할 수 없다는 오류가 떴음. 그게 바뀐 건가?
  • 비교 차트에 ChatGPT를 넣지 않았음. 그 자체로 많은 걸 말해줌

    • 그건 짚을 만함. 모르는 사람을 위해 말하면, ChatGPT Image 2는 ELO가 1387로 터무니없이 높고, 2위 모델 1273보다 100점 이상 높음(https://arena.ai/leaderboard/text-to-image)
      대신 지연 시간이 문제고, ChatGPT Image 2의 High 설정은 1024x1024에서 약 2분으로 느림
      어느 쪽이든 이 차트에 넣었으면 차트를 쓸모없게 왜곡했을 것임
      ChatGPT Image 2에 대한 글을 쓰고 싶지만, 이제 사람들은 세밀한 이미지 생성에는 관심이 없는 것 같음. 기존 테스트에서는 ChatGPT Image 2가 전부 압도하는데도 그렇다
  • Grok의 이미지 모델이 여기서 강조한 거의 모든 지표에서 Nano Banana를 이긴다는 게 좀 놀라움

    • 정말 그런가? 내가 못 본 게 있나? 첫째로는 사실이 아닌 것 같고, Lite가 아닌 버전들은 전반적으로 Grok을 이기는 듯함
      둘째로 이건 애초에 저비용 대량 생성 모델이지 최첨단 프런티어 모델이 아니므로, 벤치마크가 낮은 건 당연함
  • Nano Banana Pro가 마음에 들었음. 아직 로컬 대안이 있나? Qwen Image, Klein, 최근 Krea 얘기를 들었는데 추천할 만한 게 궁금함

    • Krea-2는 훌륭함. 제한적인 라이선스, 출력 속도, JSON 프롬프팅을 감수할 수 있다면 Ideogram 4가 최첨단 모델에 아마 가장 가까움
      내 프로필의 GenAI Showdown을 보면 로컬 및 독점 모델들과 비교 벤치마크가 있음
      실제로 Gemini 2.5, 즉 원래 NB보다 높은 점수를 냈는데 꽤 인상적임
    • Krea는 좋음. 공개 최첨단 모델에 대한 정보는 r/StableDiffusion을 보면 됨
  • 이미지 생성 쪽은 많이 뒤처져 있어서, 가끔 역할극 토큰이나 장난, 개인용 임시 자산 만들 때만 씀. 내 기준에서는 이건 미친 수준임
    2초 정도에 이미지를 만들 수 있음. 예전에는 ChatGPT로 같은 품질 이미지를 만들려면 30초에서 1분 걸렸음
    여기 부정적인 반응이 이해가 안 됨

    • 그래도 ChatGPT의 디테일이 훨씬 좋음. Nano Banana가 따라잡지 못하는 복잡한 6컷 만화 같은 것도 만들 수 있음
      그리고 부정적인 반응 상당수는 AI 아트라는 개념 자체를 싫어해서 실패하길 바라는 사람들에게서 나옴
    • 쓰임새가 다름.
      이미지 자체가 중심인 작업을 하는 사람들은 이미지당 더 많은 비용을 쓰고 싶어함
      반면 이미지가 보고서의 일부거나 버릴 결과물, 데모에 들어가는 경우라면 저렴한 접근이 더 나음
  • 이 페이지의 “hands on” 섹션에 나온 실시간 프로토타입 같은 건 어떻게 얻는지 궁금함
    gemini.g에서는 캔버스를 추가하거나 이미지 생성을 쓸 수는 있는데, “space lift” 프롬프트를 어디에 넣어야 데모처럼 나오는지 잘 모르겠음

  • 와, 지연 시간이 엄청나게 줄었음. 이 정도면 몇몇 활용 사례가 새로 열릴 텐데, 링크된 웹페이지는 모델 간 차이를 이해하기 쉽게 설명하진 않음
    다만 일반 이미지 모델을 써본 개인 경험으로는, 내 작업 흐름에서는 Google이 가장 좋다고 봄. 물론 극동권 제공업체들은 아직 써보지 않았음
    다른 사람들은 어떻게 생각하는지 궁금함