본문 바로가기
IT

구글, 속도와 추론 능력 균형 맞춘 'Gemini 2.5 Flash' 프리뷰 공개

by 카메라의눈 2025. 4. 18.
반응형
기존 플래시 모델 기반으로 추론 기능 대폭 강화… 비용 효율성 유지
개발자 위한 '하이브리드 추론' 기능 첫 탑재… Gemini 앱에도 적용
Gemini 2.5 Flash
Gemini 2.5 Flash

 

구글(Google)이 자사의 인공지능 모델 Gemini 제품군의 최신 모델인 Gemini 2.5 Flash의 초기 프리뷰 버전을 Gemini API (Google AI StudioVertex AI 통해) 및 Gemini 앱에서 공개한다고 자사 블로그를 통해 밝혔다.
 
이번에 공개된 Gemini 2.5 Flash는 기존 2.0 Flash 모델의 강점인 빠른 속도와 비용 효율성을 유지하면서도 추론 능력을 대폭 향상시킨 것이 특징이다. 구글은 이 모델이 뛰어난 성능 대비 비용 효율성을 갖추고 있어, 개발자들에게 매력적인 선택지가 될 것이라고 강조했다.
 

 
특히 Gemini 2.5 Flash는 구글 최초의 완전한 하이브리드 추론(hybrid reasoning) 모델이라는 점에서 주목받는다. 이 기능을 통해 개발자는 모델의 '생각하기(thinking)' 기능을 켜거나 끌 수 있으며, '생각 예산(thinking budgets)'을 설정하여 응답 품질, 비용, 지연 시간(latency) 간의 균형을 최적화할 수 있다. '생각하기' 기능을 끈 상태에서도 개발자들은 기존 2.0 Flash의 속도를 유지하면서도 향상된 성능을 경험할 수 있다.

blog.google
출처:blog.google

Gemini 2.5 Flash 주요 특징

모델  징설명
주요 개선 사항 기존 2.0 Flash 기반, 추론 능력 대폭 향상
핵심 기능 하이브리드 추론: '생각하기' 기능 On/Off, '생각 예산' 설정 가능
강점 뛰어난 성능 대비 비용 효율성, 빠른 속도
사용 가능 플랫폼 Gemini API (Google AI Studio, Vertex AI), Gemini 앱
활용 예시 Gemini 앱 내 Canvas 기능 등과 연동하여 문서 및 코드 작업 개선
반응형

Gemini 2.5 Flash는 개발자뿐만 아니라 일반 사용자들도 Gemini 앱을 통해 경험할 수 있다. 또한, 사용자가 문서나 코드를 다듬을 수 있는 대화형 공간인 '캔버스(Canvas)'와 같은 새로운 기능과 함께 사용될 수 있어 활용성이 더욱 높아질 것으로 기대된다.
 
구글은 이번 프리뷰 버전을 통해 개발자 및 사용자들의 피드백을 적극적으로 수렴하여 모델을 더욱 개선해 나갈 계획이다. 개발자들은 Gemini 2.5 Flash를 활용하여 다양한 애플리케이션을 구축하고, 구글은 이를 통해 실제 사용 환경에서의 모델 성능과 유용성을 검증할 수 있을 것이다.


이번 Gemini 2.5 Flash 출시는 AI 모델 개발에서 성능뿐만 아니라 속도, 비용 효율성, 개발 유연성 등 다양한 요소를 균형 있게 고려하는 최신 트렌드를 반영한다. 특히 사용자가 직접 모델의 추론 과정을 제어할 수 있는 하이브리드 추론 기능은 향후 AI 모델 개발 방향에 새로운 기준을 제시할 가능성이 있다.
 
구글은 "Gemini 2.5 Flash가 개발자들의 앱에서 어떻게 활용될지 기대하며, 사용자들의 피드백을 기다린다"고 밝혔다.
 

Gemini Developer API | Gemma open models  |  Google AI for Developers

Build with Gemini 2.0 Flash, 2.0 Pro, and Gemma using the Gemini API and Google AI Studio.

ai.google.dev

 

반응형