본문 바로가기
반응형

이미지생성AI2

구글 딥마인드, ‘비전 바나나’ 공개…이미지 생성 AI가 시각 이해까지 수행 객체 분할·깊이 추정 등 2D·3D 비전 과제에서 전문 모델과 경쟁 구글 딥마인드 연구진이 이미지 생성 모델을 기반으로 시각 이해 작업까지 수행하는 통합 모델 ‘비전 바나나’를 공개했다. 연구진은 이미지 생성 학습이 대형언어모델의 사전학습처럼 시각 세계에 대한 일반화된 표현을 형성할 수 있다고 설명했다. 비전 바나나는 나노 바나나 프로를 기반으로 소량의 시각 과제 데이터를 추가 학습해 만들어졌다. 비전 바나나는 이미지 속 서로 다른 사물을 색으로 구분하는 의미론적 분할, 같은 종류의 사물을 개별적으로 나누는 객체 분할, 사진 속 물체의 깊이를 추정하는 3D 이해 작업 등을 수행한다. 매일경제 보도에 따르면 기존에는 이런 작업을 위해 각 기능에 특화된 별도 비전 모델을 사용하는 경우가 많았지만, 비전 바.. 2026. 4. 26.
딥브레인AI, 이미지 생성 AI 기능 추가 한국 AI의 또 다른 도전...딥브레인AI가 선보이는 멀티모달 서비스 확장딥브레인AI가 기존 서비스에 이미지 생성 AI 기능을 새롭게 추가했다. 이는 텍스트 기반 AI 서비스에서 멀티모달 AI 서비스로의 확장을 의미하며, "나노바나나처럼 편집에 유용"하다는 평가를 받고 있다. 딥브레인AI가 추가한 이미지 생성 기능은 단순히 이미지를 만드는 것을 넘어서 편집과 활용에 특화된 기능을 제공한다. 특히 "나노바나나처럼 편집에 유용"하다는 평가는 이 기능이 기존의 이미지 생성 AI들과 차별화된 실용성을 보여준다는 의미다. 사용자들이 생성한 이미지를 바로 편집하고 수정할 수 있는 통합된 워크플로우를 제공하는 것이 핵심이다. 이 기능은 텍스트 프롬프트를 통해 원하는 이미지를 생성할 수 있을 뿐만 아니라, 생성된 이미.. 2025. 9. 9.
반응형