본문 바로가기
IT

구글, 이미지 생성 AI ‘나노 바나나 프로’ 공개… “챗GPT 모멘트 왔다”

by 카메라의눈 2025. 11. 21.
반응형
제미나이 3 기반 ‘생각하는 모드’ 탑재… 복잡한 추론·4K 렌더링 구현
사이먼 윌리슨 “놀라운 성능”… 텍스트·도표 완벽 구현해 상용화 가능성↑

나노 바나나 프로
출처:deepmind.google

 

구글이 20일(현지시간) 차세대 이미지 생성 AI 모델 ‘나노 바나나 프로(Nano Banana Pro)’를 전격 공개했다. ‘제미나이 3 프로 이미지(Gemini 3 Pro Image)’라는 정식 명칭을 가진 이 모델은 기존 생성형 AI의 한계로 지적되던 텍스트 렌더링과 복잡한 추론 능력을 획기적으로 개선해, 업계에서는 “이미지 생성 분야의 챗GPT 모멘트가 도래했다”는 평가가 나오고 있다.

반응형

기술 블로그 ‘사이먼 윌리슨 닷넷’과 외신 등에 따르면, 나노 바나나 프로는 구글의 최신 LLM인 제미나이 3를 기반으로 개발됐다. 가장 큰 특징은 ‘생각하는 모드(Thinking mode)’의 도입이다. AI가 이미지를 생성하기 전 내부적으로 구성 요소를 추론하고 중간 단계의 ‘생각 이미지’를 거쳐 최종 결과물을 도출하는 방식이다. 이를 통해 사용자의 복잡한 프롬프트를 정확하게 반영한 고품질 4K 이미지를 생성할 수 있다.

 

특히 그동안 이미지 생성 AI의 난제로 꼽히던 텍스트 묘사 능력이 완벽에 가깝게 구현됐다. 인포그래픽, 메뉴판, 다이어그램 등에 들어가는 미세한 텍스트를 일그러짐 없이 표현할 수 있어 상업적 활용도가 대폭 높아질 전망이다. 구글 검색과 실시간으로 연동돼 현재 날씨 지도나 주식 차트 같은 최신 정보를 시각화하는 ‘그라운딩(Grounding)’ 기능도 탑재됐다.

 

유명 개발자 사이먼 윌리슨은 자신의 블로그를 통해 “며칠간 프리뷰 버전을 사용해본 결과, 놀라울 정도로 유능한 모델”이라며 “복잡한 다중 편집 명령을 수행하고 차트나 도표를 정확히 그려내는 능력은 기존 모델들을 압도한다”고 평가했다.

 

이 모델은 최대 14장의 참조 이미지를 동시에 인식해 결과물에 반영할 수 있다. 여기에는 사물 이미지 6장, 인물 레퍼런스 5장 등이 포함돼 캐릭터의 일관성을 유지하거나 특정 스타일을 모방하는 작업이 훨씬 수월해졌다.

 

구글은 딥페이크 등 오남용 방지를 위해 생성된 모든 이미지에 육안으로는 보이지 않는 디지털 워터마크 ‘신스ID(SynthID)’를 내장했다. 사용자는 제미나이 앱을 통해 해당 이미지가 AI로 생성되었는지 즉시 판별할 수 있다.

 

 

 

출처:

반응형