본문 바로가기
IT

구글, 이미지 기반 AI 생성 도구 'Whisk' 공개

by 카메라의눈 2024. 12. 17.
반응형
"이미지를 프롬프트로 활용해 빠르고 재미있는 창작 과정을 제공하는 새로운 실험"

구글, 이미지 기반 AI 생성 도구 'Whisk' 공개
출처:구글

 

혁신적인 이미지 생성 방식

Google Labs가 공개한 Whisk는 기존 텍스트 프롬프트 방식을 넘어 이미지를 직접 입력해 새로운 이미지를 생성하는 혁신적인 도구입니다. Gemini AI와 Imagen 3 모델을 활용해 주제, 장면, 스타일 세 가지 이미지를 조합하여 독특한 결과물을 만들어냅니다.

 

LABS.GOOGLE

Labs.Google is Google’s home for the latest AI tools, technology and discourse.

labs.google

작동 원리와 특징

Whisk는 업로드된 이미지의 '본질'을 포착하여 자동으로 상세한 캡션을 생성하고, 이를 Imagen 3에 전달하여 새로운 이미지를 만듭니다. 사용자는 생성된 프롬프트를 수정하여 결과물을 더욱 정교하게 다듬을 수 있습니다.

반응형

활용 가능성

디지털 플러시, 에나멜 핀, 스티커 등 다양한 창작물 제작에 활용할 수 있으며, 빠른 시각적 탐색과 브레인스토밍에 특히 유용합니다.


FAQ

Q: Whisk는 어떤 사용자가 이용할 수 있나요?
A: 현재 미국 사용자만 Google Labs를 통해 이용 가능합니다.

 

Q: 기존 AI 이미지 생성기와의 차이점은?
A: 텍스트 대신 이미지를 직접 입력하여 더 직관적인 창작이 가능합니다.

 

Q: 결과물의 정확도는 어떤가요?
A: 완벽한 복제보다는 이미지의 본질적 특성을 반영한 새로운 창작물을 만듭니다.

 

Q: 텍스트 프롬프트도 사용할 수 있나요?
A: 네, 이미지 생성 후 텍스트로 추가 수정이 가능합니다.

 

Q: 생성된 이미지는 저장할 수 있나요?
A: My Library 섹션에서 생성된 이미지를 관리하고 저장할 수 있습니다.


 

[관련 출처]

  • Google Labs Whisk 공식 페이지
  • Imagen 3 기술 문서
  • Google AI 블로그
  • Gemini AI 소개

 

반응형