구글이 만든 Gemini 기반의 이미지 생성·편집 모델. 사진을 올리고 말로 "이렇게 바꿔줘"라고 하면 그대로 고쳐주는 게 핵심이다.
Nano Banana는 구글 딥마인드가 만든 이미지 생성·편집 모델의 별칭이다. 정식 이름은 Gemini 2.5 Flash Image인데, 출시 전 테스트 단계에서 붙은 "nano banana"라는 코드네임이 입소문을 타면서 그대로 공식 애칭이 됐다. 이후 Gemini 3 Pro를 기반으로 한 상위 버전 Nano Banana Pro(Gemini 3 Pro Image)까지 나오면서, 지금은 속도 위주의 기본 모델과 품질 위주의 Pro 모델을 묶어 부르는 이름이 됐다.
가장 큰 특징은 이미지 전용 모델이 따로 도는 게 아니라 Gemini라는 언어 모델 안에 이미지 능력이 통합돼 있다는 점이다. 그래서 "노을 지는 하늘로 바꾸되 인물 얼굴은 그대로 둬" 같은 복잡한 지시를 글의 뉘앙스까지 이해해서 처리한다.
이 모델이 화제가 된 건 대화형 편집 때문이다. 한 번 생성한 그림을 두고 "배경만 바다로", "이번엔 모자를 씌워줘"처럼 계속 말을 걸어 조금씩 고쳐나갈 수 있다. 이때 캐릭터 일관성이 유지돼서, 같은 인물이 여러 장면에 등장하는 동화책이나 웹툰 컷을 만들 때 얼굴이 계속 같은 사람으로 나온다.
여러 장의 사진을 한 장으로 합성하는 것도 강점이다. 내 얼굴 사진과 옷 사진, 배경 사진을 주면 셋을 자연스럽게 합쳐준다. Pro 버전은 여기에 더해 추론 능력을 활용해 표·인포그래픽처럼 글자가 정확히 박혀야 하는 이미지를 만드는 데 강하고, 여러 언어 텍스트도 깨지지 않게 렌더링한다.
가장 흔한 진입점은 Gemini API다. gemini-2.5-flash-image 같은 모델 ID로 요청을 보내면 텍스트만으로 그림을 만들거나(text-to-image), 이미지와 지시문을 같이 넣어 편집을(image-and-image-to-image) 한다. Google AI Studio에서 프롬프트를 먼저 실험해보고 바로 코드로 내보내거나 GitHub에 저장하는 식으로 앱을 붙이는 흐름이 자연스럽다.
직접 코드를 안 짜더라도 손이 닿는다. Gemini 앱에서 사진을 올려 편집하거나, 어도비 Firefly·포토샵의 Generative Fill에 파트너 모델로 들어가 있어 기존 디자인 작업 안에서 호출된다. 상세페이지 이미지나 광고 소재를 빠르게 여러 버전 뽑는 실무 용도로 많이 쓰인다.
생성·편집된 모든 이미지에는 구글의 SynthID 워터마크가 눈에 안 보이게 새겨진다. AI로 만든 이미지임을 추적하기 위한 장치라, 출처 투명성이 필요한 작업에서는 이 점을 알고 써야 한다.