Nano Banana 2 Lite

(deepmind.google)

1P by GN⁺ 20시간전 | ★ favorite | 댓글 1개

Google DeepMind의 Gemini Image 계열에 추가된 Nano Banana 2 Lite는 이미지 생성·편집을 더 빠르고 저렴하게 돌리려는 모델로, 반복이 많은 시각 작업의 비용 부담을 낮추는 데 초점을 둠
핵심 축은 낮은 지연시간과 대규모 비용 효율이며, 무거운 프로덕션 모델보다 낮은 비용으로 수천 장의 이미지를 생성할 수 있음
품질 면에서는 Nano Banana 계열의 제어력과 정확도를 유지하면서 캐릭터 일관성, 정밀 편집, 실제 세계 지식 활용을 지원함
Space Lift, Gridscape, Peek-A-Word, Anywhere 같은 사례는 이미지 생성이 앱 흐름을 끊지 않을 만큼 빨라질 때 가능한 사용자 경험을 보여줌
작은 얼굴, 정확한 철자, 세부 묘사, 데이터 기반 결과, 번역·현지화, 복잡한 편집과 합성에서는 오류가 날 수 있어 생성 결과 검토가 필요함

빠른 생성과 낮은 비용을 앞세운 Gemini Image 모델

Nano Banana 2 Lite는 Google DeepMind가 공개한 Gemini Image 모델로, 빠른 이미지 생성·편집과 낮은 비용을 목표로 함
주요 사용자는 크리에이터, 비즈니스, 개발자이며, 여러 시각적 아이디어를 빠르게 탐색하는 워크플로에 맞춰짐
Google DeepMind는 이 모델을 지금까지 가장 빠르고 효율적인 Gemini Image 모델로 소개하며, 가장 낮은 비용으로 고속 생성과 편집을 제공한다고 밝힘
접근 경로는 다음과 같음
- Google AI Studio
- Gemini 앱의 Flash-Lite mode
- Gemini API
- Gemini Enterprise Agent Platform

속도, 비용, 품질의 균형

지연시간 단축이 핵심으로, 빠른 탐색과 반복 작업을 지원함
대규모 생성에서는 더 무거운 프로덕션 모델보다 훨씬 낮은 비용으로 수천 장의 이미지를 만들 수 있음
품질은 Nano Banana에서 기대하는 제어력과 정확도를 더 빠르게 제공하는 방향임
- 캐릭터 일관성 유지
- 정밀한 시각 편집
- 실제 세계 지식 활용
프롬프트에는 캐릭터, 배경, 전체 분위기 등 원하는 요소를 자세히 적을수록 의도한 이미지에 가까워질 수 있음
프롬프트 가이드는 View prompt guide와 Learn how to prompt에서 제공됨

이미지 생성 속도를 전제로 한 앱 사례

Space Lift는 방 사진을 업로드하면 Mid-Century Modern부터 Bohemian Chic까지 다양한 인테리어 콘셉트를 즉시 생성하는 앱임
Gridscape는 무한 캔버스에서 질문을 입력하면 Nano Banana 2 Lite와 Gemini 3.1 Flash Lite가 만든 텍스트·이미지로 정보 노드를 구성함
- 사용자는 클릭 가능한 경로를 따라 관련 개념을 더 깊게 탐색할 수 있음
Peek-A-Word는 선택한 텍스트를 AI 생성 시각 자료로 바꾸고, 간결한 정의와 문맥 이미지를 한 공간에서 제공함
- 탭 전환 없이 학습 흐름을 유지하는 데 초점을 둠
Anywhere는 Nano Banana 2 Lite로 만든 인터랙티브 3D 지구본 앱임
- 이미지를 첨부하면 세계 명소를 배경으로 개인화된 엽서 시리즈를 생성함
- 사용자는 지구본을 돌리고 사진을 클릭해 가상 여행지 정보를 볼 수 있음

비교 지표와 모델 카드

Google DeepMind는 Nano Banana 2 Lite를 지금까지 가장 효율적인 모델로 소개하며, 품질과 속도의 균형이 좋다고 밝힘
비교 대상에는 프리미어 모델인 Nano Banana 2가 포함됨
비교 영역은 프롬프트 준수, 세부 표현, 제어력 등 이미지 생성 품질 요소를 포함함
성능 섹션은 다음 지표를 제시함
- Image Editing: lmarena.ai 기준 경쟁 모델 대비 이미지 편집 Elo 점수
- Image Generation: lmarena.ai 기준 경쟁 모델 대비 이미지 생성 Elo 점수
- Latency per 1k resolution image: artificialanalysis.ai 데이터 기반 1k 해상도 이미지당 지연시간
- Price per 1k resolution image: 1k 해상도 이미지당 가격
모델 카드는 View model card에서 제공됨

파트너들이 본 활용 가능성

Figma Weave는 Nano Banana 2 Lite가 노드 기반 캔버스에서 디자이너가 더 많은 아이디어를 탐색하고 독특한 이미지를 만드는 데 도움이 된다고 평가함
Manus AI는 자율 워크플로 안에서 슬라이드 덱과 웹 페이지용 실시간 이미지 생성을 테스트함
- 속도는 AI 에이전트의 빠른 시각 반복과 수초 내 결과 제공에 적합하다고 평가함
- 이미지 품질은 전체 Nano Banana 2에 가깝다고 봄
Artlist는 생성 속도가 상상보다 빨라지면 사용자가 도구를 기다리지 않고 아이디어 안에 머물 수 있다고 평가함
Weekend는 음성 제어 TV 게임 Wit’s End에서 instant-ramen이 Gemini 3.1 Flash Image보다 1k 이미지 생성 기준 약 2.7× 빠르다고 밝힘
- 텍스트-이미지, 편집, 다중 이미지 합성을 하나의 드롭인 API로 처리함
Latitude는 플레이어가 탐험하는 동안 세계를 생성하는 엔진에서 이미지 생성 속도가 중요하며, instant-ramen이 플레이 경험을 따라갈 만큼 빠른 시각 생성을 가능하게 한다고 평가함

아직 검토가 필요한 한계

Gemini는 다양한 이미지를 만들 수 있지만 일부 기능은 아직 개선 중이며, 생성 이미지는 직접 확인해야 함
시각·텍스트 충실도에서는 작은 얼굴, 정확한 철자, 이미지의 세부 묘사에서 어려움이 있을 수 있음
데이터와 사실 정확도에서는 현실 세계 지식이 광범위하지만 완전하지 않음
- 인포그래픽 생성, 다이어그램 주석, 복잡한 데이터 표현에서 정보를 잘못 해석하거나 사실과 다른 결과를 만들 수 있음
- 데이터 기반 출력은 검증이 필요함
번역과 현지화에서는 여러 언어의 텍스트 생성과 번역이 가능하지만, 문법, 철자, 문화적 뉘앙스, 관용 표현에서 어려움이 있을 수 있음
복잡한 편집과 이미지 블렌딩에서는 마스크 편집, 낮을 밤으로 바꾸는 큰 조명 변경, 여러 이미지 합성에서 부자연스러운 결과나 시각적 아티팩트, 단절된 장면이 나올 수 있음
캐릭터 일관성은 강점이지만 항상 정확하지는 않으며, Google DeepMind는 이를 더 안정적으로 만들기 위해 개선 중임

안전 기능과 사용상 주의

Google DeepMind는 데이터셋의 유해 콘텐츠를 줄이고 유해 출력 가능성을 낮추기 위해 광범위한 필터링과 데이터 라벨링을 사용함
콘텐츠 안전성에서는 아동 안전과 표현을 포함해 레드팀과 평가를 수행함
생성 이미지에는 최신 개인정보 보호·안전 기능이 포함되며, SynthID가 AI 생성 이미지를 식별할 수 있도록 보이지 않는 디지털 워터마크를 이미지에 직접 삽입함
SynthID 정보는 Learn more에서 제공됨
Gemini 3.1 Flash-Lite Image 같은 LLM은 Google의 견해를 대표하지 않는 부정확하거나 불쾌한 콘텐츠를 제공할 수 있음
LLM이 제공한 콘텐츠를 신뢰하거나 게시하거나 사용할 때는 주의가 필요하며, 의료·법률·금융 등 전문 조언에는 의존하면 안 됨

GN⁺ 20시간전 [-]

Hacker News 의견들

집 인테리어 생성 첫 예시는 형언하기 어려울 정도로 싫음. 요즘 부동산 중개인들이 낡고 안 팔리는 아파트를 전부 AI 필터에 넣어 돌려서, 실제로 어떤 끔찍한 물건을 터무니없는 가격에 팔려는지 보기 전에 “이케아풍으로 꾸미면 이렇게 보일 수도 있다”는 이미지 수십 장을 먼저 넘겨야 함
- 이런 건 불법적인 허위 표시로 봐야 한다고 생각함. AI 사용에는 회색지대가 너무 많음
- 거의 사기에 가깝다고 봄. Streeteasy에서 어떤 아파트는 책상, 서랍장, 퀸 침대를 모두 ‘넣은’ 것처럼 보였는데, 이미지 모델이 현실에는 존재하지 않는 비율로 가구를 그냥 축소한 게 뻔했음
  실제 침실에는 퀸 침대 하나만 겨우 들어갈 수 있었음 ;(
- 아파트 실제 모습 자체를 속이는 건 사회적으로든 법적으로든 받아들일 수 없어야 한다는 데 100% 동의함. 다만 내 욕실 리모델링에서 이미지 모델은 디자인 선택에 꽤 도움이 됐음
  특히 어떤 부분에 타일을 붙였을 때 전체 공간이 어떻게 보일지 직접 상상하기 어려운 경우에 유용했음
- 내가 사는 NYC에서는 그런 보정 이미지를 올리는 게 10년도 넘게 일반적이었음
  예전에는 그런 작업을 해줄 사람을 고용하는 비용이 더 비쌌을 뿐임
  보정된 이미지는 늘 똑같이 밝은 벽과 회색 잡지풍 가구를 보여줌
  AI가 더 싸게 만들었을 뿐, 결국 이렇게 될 수밖에 없었음
  이런 식으로 보정된 이미지는 보정 사실을 알리는 작은 워터마크가 붙어 있긴 함
- 좋은 사진가만 있어도 효과가 엄청남. 친구가 집을 팔 때 매물 사진에서 집이 얼마나 좋아 보이는지, 또 내가 작지 않다는 걸 아는데도 얼마나 커 보이는지 보고 놀랐음
  AI 필터가 나오기 전에도 있던 문제라 새롭지는 않지만, 지금은 훨씬 더 심해지고 비용도 낮아졌음
이 모델을 테스트할 수 있는 조기 접근 권한을 받았음. 업무를 통해서였고, Google이 개인적으로 나를 좋아하게 된 건 여전히 아님 lol
여기서 광고한 대로 동작하고, 좋은 텍스트 렌더링 같은 요소에서는 Nano Banana 2를 증류한 버전처럼 보임. Nano Banana 1은 이 부분이 훨씬 약함
물론 세밀한 프롬프트에서는 기본 Nano Banana 2 수준은 전혀 아님. 가장 큰 불만은 NB2에서는 프로그래밍으로 화면비를 강제할 수 있는데 NB2L에서는 안 된다는 점임
다만 이미지당 $0.034라는 가격은 예상보다 높음. 보통 가격은 생성 시간과 연관되는데, Nano Banana 1보다 절반 시간에 생성하면서도 Nano Banana 1은 이미지당 $0.039임
NB1 파이프라인을 NB2L로 바로 대체할 수 있다는 Google의 주장은 타당함
어제 Google은 Gemini 앱에서 무료 이미지 생성을 허용한다고 발표했지만(https://blog.google/innovation-and-ai/products/gemini-app/pe...), 어떤 모델을 쓰는지는 명시하지 않았음. Nano Banana 2 Lite의 주된 동기가 여기에 있다고 봄
- Vertex를 통해 NB2 Lite에서도 프로그래밍으로 화면비를 설정할 수 있음 [1]. GenAI Showdown용 이미지를 만들 때 쓰는 프로그램을 업데이트해서 모델 ID를 gemini-3.1-flash-lite-image로 바꿨고, 16:9, 4:3 같은 화면비를 사용할 수 있었음
  [1] - https://cloud.google.com/developers/vertex-ai
- 어떤 업무를 하길래 자동 이미지 생성을 대규모로 해야 하는지 궁금함
괜찮긴 한데 Google의 망가진 AI Studio 위에 있음. 거기 기능 절반은 Google One 계정이 필요해서 못 씀
나는 Workspace 계정이라 자격이 안 되고, 전환도 못 함. Google One은 자체 도메인을 지원하지 않기 때문임
그럼 멋진 이메일 주소와 Banana를 둘 다 쓰려면 계정 두 개를 운영하고 비용까지 내야 하나? 여기서 맞는 유료 Google 계정 수는 0개라는 생각이 들기 시작함
- 비슷한 상황이었음. Google은 모델 사용과 결제 사용자 경험을 정말 개선해야 함
  내 해결책은 OpenRouter였음. 개발·테스트용 채팅에서 Google 모델로 이미지를 생성할 수 있고, 같은 프롬프트를 다른 모델들과 나란히 실행해 볼 수도 있음. 가벼운 이미지 생성에는 아주 편리함
- 나도 거의 같은 처지임. 개인용으로 One과 Workspace를 둘 다 내고 있는데, 이런 기능에 어느 쪽을 써야 할지 애매함
  대체로 더 많은 맥락이 있는 개인 계정을 기본으로 쓰지만, 그러면 Workspace Drive 같은 자료를 가져오는 데 몇 단계가 더 필요함
  그리고 Project Genie 같은 건 Workspace에서 아예 사용할 수 없는데, 꽤 이상하게 느껴짐
- 약간 노골적인 홍보지만, burlap은 Gemini Studio나 OpenAI의 키를 넣어서 웹 인터페이스를 건드리지 않고 이것저것 시험해 볼 수 있게 해줌. 그래서 만들었음
  https://www.burlap.app/download
속도는 확실히 인상적임. 기본 NB2는 이미지당 약 30초인데, 이건 5초 미만으로 보임
아이들을 등장인물로 넣어 삽화가 있는 이야기를 만들어 주는 앱을 만들었음. 삽화 스타일은 유지하면서도 아이들의 닮은꼴을 우선하고 싶었음
여러 모델을 테스트했지만, 스타일화한 상태에서 닮은꼴을 유지하는 데 이만큼 가까운 모델은 없어 보임. 다른 모델들은 흔한 캐릭터처럼 만들어 버림
사용자가 최대한 빨리 “아하” 순간을 느끼게 하고 싶어서 앱 온보딩에 이 모델을 넣는 게 기대됨. 30초 이상 기다리는 건 이상적이지 않음
다만 실제 삽화에는 여전히 기본 NB2를 쓸 예정임. 이 Lite 버전은 다른 사람들이 말한 것처럼 뉘앙스와 일관성에서 아직 약간 문제가 있음
- 비슷한 걸 시도했는데, 어린이와 관련된 건 할 수 없다는 오류가 떴음. 그게 바뀐 건가?
비교 차트에 ChatGPT를 넣지 않았음. 그 자체로 많은 걸 말해줌
- 그건 짚을 만함. 모르는 사람을 위해 말하면, ChatGPT Image 2는 ELO가 1387로 터무니없이 높고, 2위 모델 1273보다 100점 이상 높음(https://arena.ai/leaderboard/text-to-image)
  대신 지연 시간이 문제고, ChatGPT Image 2의 High 설정은 1024x1024에서 약 2분으로 느림
  어느 쪽이든 이 차트에 넣었으면 차트를 쓸모없게 왜곡했을 것임
  ChatGPT Image 2에 대한 글을 쓰고 싶지만, 이제 사람들은 세밀한 이미지 생성에는 관심이 없는 것 같음. 기존 테스트에서는 ChatGPT Image 2가 전부 압도하는데도 그렇다
Grok의 이미지 모델이 여기서 강조한 거의 모든 지표에서 Nano Banana를 이긴다는 게 좀 놀라움
- 정말 그런가? 내가 못 본 게 있나? 첫째로는 사실이 아닌 것 같고, Lite가 아닌 버전들은 전반적으로 Grok을 이기는 듯함
  둘째로 이건 애초에 저비용 대량 생성 모델이지 최첨단 프런티어 모델이 아니므로, 벤치마크가 낮은 건 당연함
Nano Banana Pro가 마음에 들었음. 아직 로컬 대안이 있나? Qwen Image, Klein, 최근 Krea 얘기를 들었는데 추천할 만한 게 궁금함
- Krea-2는 훌륭함. 제한적인 라이선스, 출력 속도, JSON 프롬프팅을 감수할 수 있다면 Ideogram 4가 최첨단 모델에 아마 가장 가까움
  내 프로필의 GenAI Showdown을 보면 로컬 및 독점 모델들과 비교 벤치마크가 있음
  실제로 Gemini 2.5, 즉 원래 NB보다 높은 점수를 냈는데 꽤 인상적임
- Krea는 좋음. 공개 최첨단 모델에 대한 정보는 r/StableDiffusion을 보면 됨
이미지 생성 쪽은 많이 뒤처져 있어서, 가끔 역할극 토큰이나 장난, 개인용 임시 자산 만들 때만 씀. 내 기준에서는 이건 미친 수준임
2초 정도에 이미지를 만들 수 있음. 예전에는 ChatGPT로 같은 품질 이미지를 만들려면 30초에서 1분 걸렸음
여기 부정적인 반응이 이해가 안 됨
- 그래도 ChatGPT의 디테일이 훨씬 좋음. Nano Banana가 따라잡지 못하는 복잡한 6컷 만화 같은 것도 만들 수 있음
  그리고 부정적인 반응 상당수는 AI 아트라는 개념 자체를 싫어해서 실패하길 바라는 사람들에게서 나옴
- 쓰임새가 다름.
  이미지 자체가 중심인 작업을 하는 사람들은 이미지당 더 많은 비용을 쓰고 싶어함
  반면 이미지가 보고서의 일부거나 버릴 결과물, 데모에 들어가는 경우라면 저렴한 접근이 더 나음
이 페이지의 “hands on” 섹션에 나온 실시간 프로토타입 같은 건 어떻게 얻는지 궁금함
gemini.g에서는 캔버스를 추가하거나 이미지 생성을 쓸 수는 있는데, “space lift” 프롬프트를 어디에 넣어야 데모처럼 나오는지 잘 모르겠음
와, 지연 시간이 엄청나게 줄었음. 이 정도면 몇몇 활용 사례가 새로 열릴 텐데, 링크된 웹페이지는 모델 간 차이를 이해하기 쉽게 설명하진 않음
다만 일반 이미지 모델을 써본 개인 경험으로는, 내 작업 흐름에서는 Google이 가장 좋다고 봄. 물론 극동권 제공업체들은 아직 써보지 않았음
다른 사람들은 어떻게 생각하는지 궁금함

답변달기

Nano Banana 2 Lite

빠른 생성과 낮은 비용을 앞세운 Gemini Image 모델

속도, 비용, 품질의 균형

이미지 생성 속도를 전제로 한 앱 사례

비교 지표와 모델 카드

파트너들이 본 활용 가능성

아직 검토가 필요한 한계

안전 기능과 사용상 주의

함께 보면 좋은 글 β

댓글과 토론

Hacker News 의견들