반응형
"이미지를 프롬프트로 활용해 빠르고 재미있는 창작 과정을 제공하는 새로운 실험"
혁신적인 이미지 생성 방식
Google Labs가 공개한 Whisk는 기존 텍스트 프롬프트 방식을 넘어 이미지를 직접 입력해 새로운 이미지를 생성하는 혁신적인 도구입니다. Gemini AI와 Imagen 3 모델을 활용해 주제, 장면, 스타일 세 가지 이미지를 조합하여 독특한 결과물을 만들어냅니다.
작동 원리와 특징
Whisk는 업로드된 이미지의 '본질'을 포착하여 자동으로 상세한 캡션을 생성하고, 이를 Imagen 3에 전달하여 새로운 이미지를 만듭니다. 사용자는 생성된 프롬프트를 수정하여 결과물을 더욱 정교하게 다듬을 수 있습니다.
반응형
활용 가능성
디지털 플러시, 에나멜 핀, 스티커 등 다양한 창작물 제작에 활용할 수 있으며, 빠른 시각적 탐색과 브레인스토밍에 특히 유용합니다.
FAQ
Q: Whisk는 어떤 사용자가 이용할 수 있나요?
A: 현재 미국 사용자만 Google Labs를 통해 이용 가능합니다.
Q: 기존 AI 이미지 생성기와의 차이점은?
A: 텍스트 대신 이미지를 직접 입력하여 더 직관적인 창작이 가능합니다.
Q: 결과물의 정확도는 어떤가요?
A: 완벽한 복제보다는 이미지의 본질적 특성을 반영한 새로운 창작물을 만듭니다.
Q: 텍스트 프롬프트도 사용할 수 있나요?
A: 네, 이미지 생성 후 텍스트로 추가 수정이 가능합니다.
Q: 생성된 이미지는 저장할 수 있나요?
A: My Library 섹션에서 생성된 이미지를 관리하고 저장할 수 있습니다.
[관련 출처]
- Google Labs Whisk 공식 페이지
- Imagen 3 기술 문서
- Google AI 블로그
- Gemini AI 소개
반응형
'IT' 카테고리의 다른 글
이스트소프트의 혁신적인 AI 휴먼 서비스, '페르소'의 등장 (1) | 2024.12.18 |
---|---|
ChatGPT 웹 검색 기능: 기존 검색 엔진과의 차별점 (0) | 2024.12.17 |
메타, 레이밴 스마트 글래스에 실시간 AI 비디오 기능 추가 (1) | 2024.12.17 |
애플, iOS 18.2에서 ChatGPT와 시리 통합 발표 (1) | 2024.12.12 |
애플, 브로드컴과 AI 서버 칩 개발 중 (0) | 2024.12.12 |