본문 바로가기
반응형

나노바나나7

구글 딥마인드, ‘비전 바나나’ 공개…이미지 생성 AI가 시각 이해까지 수행 객체 분할·깊이 추정 등 2D·3D 비전 과제에서 전문 모델과 경쟁 구글 딥마인드 연구진이 이미지 생성 모델을 기반으로 시각 이해 작업까지 수행하는 통합 모델 ‘비전 바나나’를 공개했다. 연구진은 이미지 생성 학습이 대형언어모델의 사전학습처럼 시각 세계에 대한 일반화된 표현을 형성할 수 있다고 설명했다. 비전 바나나는 나노 바나나 프로를 기반으로 소량의 시각 과제 데이터를 추가 학습해 만들어졌다. 비전 바나나는 이미지 속 서로 다른 사물을 색으로 구분하는 의미론적 분할, 같은 종류의 사물을 개별적으로 나누는 객체 분할, 사진 속 물체의 깊이를 추정하는 3D 이해 작업 등을 수행한다. 매일경제 보도에 따르면 기존에는 이런 작업을 위해 각 기능에 특화된 별도 비전 모델을 사용하는 경우가 많았지만, 비전 바.. 2026. 4. 26.
구글, ‘제미나이 3’·‘픽셀 10’ 활용 팁 40선 공개… “일상의 AI 혁명” 제미나이 3, 복잡한 주제 시각화·대화형 시뮬레이션 제공픽셀 10 ‘대신 받기’·제미나이 홈 자동화 등 생활 밀착형 기능 대거 선보여 구글이 최신 AI 모델 ‘제미나이 3(Gemini 3)’와 차세대 스마트폰 ‘픽셀 10’ 등을 활용한 ‘2025년 가장 유용한 AI 팁 40선’을 공개했다. 학습 보조부터 여행 계획, 업무 자동화에 이르기까지 AI가 일상 깊숙이 파고든 모습이다. 구글은 19일(현지시간) 공식 블로그 ‘더 키워드(The Keyword)’를 통해 올 한 해 선보인 AI 기술의 핵심 활용법을 정리해 발표했다. 이번 발표는 제미나이 3, 픽셀 10, 픽셀 워치 4 등 최신 하드웨어와 소프트웨어의 유기적인 결합을 강조한 점이 특징이다.‘제미나이 3’로 학습·연구 혁신 구글의 최신 모델인 ‘제미나이.. 2025. 12. 20.
구글, AI 사진 편집 ‘나노 바나나’·‘애스크 포토’ 공개 제미나이 앱, ‘나노 바나나’ 모델로 일관성 있는 인물 수정구글 포토 ‘애스크 포토’, 100개국·17개 언어 확대 구글이 제미나이(Gemini) 앱과 구글 포토의 AI 기능을 대폭 강화했다. 구글은 딥마인드의 최신 이미지 편집 모델인 ‘나노 바나나(Nano Banana)’를 제미나이 앱에 도입하고, 구글 포토의 AI 검색 기능인 ‘애스크 포토(Ask Photos)’를 100개국 이상으로 확대한다고 밝혔다.‘나노 바나나’는 구글 딥마인드가 개발한 ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’ 모델의 별칭이다. 이 기능은 제미나이 앱에 탑재되어 사용자가 사진 속 인물의 모습을 일관되게 유지하면서 의상, 배경, 직업 등을 변경할 수 있게 돕는다. 또한 여러 장의 사진을 자연스럽.. 2025. 11. 12.
알리바바, Qwen3 컴팩트 멀티모달 모델 공개…GPT-4o 등과 경쟁 30억 활성 파라미터로 고성능 발휘, 수학·이미지 인식·에이전트 제어 강화FP8 버전 포함하여 오픈소스로 제공…HuggingFace, GitHub 등에서 이용 가능 중국 기술 대기업 알리바바(Alibaba)의 AI 연구 조직인 Qwen 팀이 'Qwen3-Omni' 계열의 새로운 소규모 멀티모달 모델 두 가지를 오픈소스로 공개했다. 이 모델들은 각각 30억 개의 활성 파라미터(3B active parameters)를 가졌음에도 불구하고, 대규모 모델인 GPT-4o 및 클로드 3 소네트(Claude 3 Sonnet)와 경쟁할 만한 고성능을 발휘한다고 발표했다. 새롭게 공개된 모델은 Qwen3-VL-30B-A3B-Instruct와 Qwen3-VL-30B-A3B-Thinking 버전이다. Qwen3 컴.. 2025. 10. 5.
구글, 제미나이 2.5 플래시 이미지 일반 공개...10가지 화면 비율 지원 확대 '나노 바나나' 코드명, 일관된 캐릭터 유지·자연어 정밀 편집 기능 강화개발자는 AI 스튜디오 및 Vertex AI에서 활용 가능, GIF 생성 기능도 추가 구글이 이미지 생성 및 편집 모델인 ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’를 일반 공개(GA)하고, 개발자 환경에서 즉시 사용할 수 있도록 했다. 코드명 ‘나노 바나나(Nano Banana)’로도 불리는 이 모델은 10가지에 달하는 다양한 화면 비율 지원과 함께 일관된 캐릭터 유지 등 창작의 자유도를 대폭 확장하는 신규 기능을 탑재했다. 이번 업데이트는 이미지 생성 및 편집 워크플로우를 가속화하고, 사용자가 시네마틱 풍경부터 소셜 미디어용 세로 이미지까지 다양한 플랫폼에 최적화된 콘텐츠를 쉽게 제작하도록 돕는 데.. 2025. 10. 5.
구글 제미니, 혁신 AI 이미지 모델 '나노 바나나' 앞세워 앱스토어 1위 석권 출시 후 사용자 2,300만 명 증가, 다운로드 및 소비자 지출 급증미국 앱스토어 ChatGPT 제치고 정상 등극, 108개국 탑 5 진입 구글의 인공지능 앱 제미니(Gemini)가 지난 8월 새로운 AI 이미지 편집 모델 '나노 바나나(Nano Banana)'를 출시한 이후 모바일 앱 채택이 급증하며 글로벌 앱스토어 차트에서 정상을 차지했습니다. 앱 인텔리전스 기업 앱피겨스(Appfigures)의 데이터에 따르면, 제미니 앱은 9월 현재까지 전월 대비 45%의 다운로드 증가율을 기록하며 빠르게 성장하고 있습니다. 제미니는 '나노 바나나' 모델 출시 직후인 9월 8일 미국 앱스토어에서 2위를 기록했으며, 이후 9월 12일에는 오픈AI의 챗GPT(ChatGPT)를 제치고 1위에 올라 현재까지 그 자리를 유.. 2025. 9. 17.
반응형