본문 바로가기
IT

구글, 제미나이 2.5 플래시 이미지 일반 공개...10가지 화면 비율 지원 확대

by 카메라의눈 2025. 10. 5.
반응형
'나노 바나나' 코드명, 일관된 캐릭터 유지·자연어 정밀 편집 기능 강화
개발자는 AI 스튜디오 및 Vertex AI에서 활용 가능, GIF 생성 기능도 추가

(출처:구글)

 

구글이 이미지 생성 및 편집 모델인 ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’를 일반 공개(GA)하고, 개발자 환경에서 즉시 사용할 수 있도록 했다. 코드명 ‘나노 바나나(Nano Banana)’로도 불리는 이 모델은 10가지에 달하는 다양한 화면 비율 지원과 함께 일관된 캐릭터 유지 등 창작의 자유도를 대폭 확장하는 신규 기능을 탑재했다.

 

이번 업데이트는 이미지 생성 및 편집 워크플로우를 가속화하고, 사용자가 시네마틱 풍경부터 소셜 미디어용 세로 이미지까지 다양한 플랫폼에 최적화된 콘텐츠를 쉽게 제작하도록 돕는 데 중점을 두었다.

 

 

제미나이 2.5 플래시 이미지의 주요 기능과 업데이트

제미나이 2.5 플래시 이미지는 단순히 이미지를 생성하는 것을 넘어, 생성 및 편집 과정에서 높은 정밀도와 일관성을 제공하는 기능들을 선보였다. 특히, 여러 장의 이미지에 걸쳐 동일한 캐릭터나 피사체의 일관성을 유지할 수 있게 되어 스토리텔링이 필요한 작업에 유용하다.

 

또한, 사용자는 이제 자연어 프롬프트를 통해 이미지의 특정 영역에 대해 정밀한 로컬 편집을 수행할 수 있다. 배경 흐림 처리, 개체 제거, 자세 변경 등 복잡한 수동 도구 없이 간단한 텍스트 명령만으로 변환이 가능하다.

 

개발자들은 구글 AI 스튜디오(Google AI Studio)와 엔터프라이즈 워크플로우를 위한 버텍스 AI(Vertex AI)를 통해 모델을 이용할 수 있다. 구글 AI 스튜디오의 새로운 ‘빌드 모드’는 단일 프롬프트로 맞춤형 AI 앱을 구축하고 코드를 GitHub로 바로 전송할 수 있는 환경을 제공한다.

구분 업데이트 내용 (주요 기능) 상세 설명
모델 가용성 일반 공개(GA) 개발자 및 기업 환경(Vertex AI)에서 즉시 프로덕션 사용 가능.
창작 일관성 캐릭터 일관성 유지 여러 프롬프트와 편집에 걸쳐 동일한 캐릭터/피사체 외관 유지.
편집 능력 자연어 정밀 편집 텍스트 프롬프트만으로 이미지의 특정 부분에 정밀한 변형 및 편집 적용.
새로운 포맷 GIF 생성 및 무한 줌 기존 이미지를 AI를 활용해 애니메이션 GIF로 변환하고, AI로 향상된 디테일에 무한 줌을 적용하는 기능.
출력 유연성 이미지 전용 출력 텍스트 출력 없이 이미지 결과물만 지정하여 얻을 수 있음.

 

새로운 화면 비율 지원 (총 10종)

 

이번 업데이트의 핵심인 10가지 화면 비율 지원은 사용자가 다양한 미디어 포맷에 맞춘 콘텐츠를 제작할 수 있도록 창작 영역을 넓혔다.

구분 화면 비율 (Aspect Ratio) 활용 예시
가로 (Landscape) 21:9, 16:9, 4:3, 3:2 시네마틱 영상, 와이드 스크린, 표준 모니터
세로 (Portrait) 9:16, 3:4, 2:3 소셜 미디어(릴스, 쇼츠), 인스타그램 스토리, 인쇄 포스터
정사각형/유연 1:1, 5:4, 4:5 인스타그램 피드, 표준 사진 인쇄

 

구글은 제미나이 2.5 플래시 이미지를 통해 개발자들이 시각적 앱의 새로운 시대를 열 수 있도록 지원하며, 모든 생성 및 편집 이미지에는 AI 생성물임을 명시하는 SynthID 디지털 워터마크가 포함된다고 밝혔다.

 

출처: Google Developers Blog

 

반응형