기존 플래시 모델 기반으로 추론 기능 대폭 강화… 비용 효율성 유지
개발자 위한 '하이브리드 추론' 기능 첫 탑재… Gemini 앱에도 적용

구글(Google)이 자사의 인공지능 모델 Gemini 제품군의 최신 모델인 Gemini 2.5 Flash의 초기 프리뷰 버전을 Gemini API (Google AI Studio 및 Vertex AI 통해) 및 Gemini 앱에서 공개한다고 자사 블로그를 통해 밝혔다.
이번에 공개된 Gemini 2.5 Flash는 기존 2.0 Flash 모델의 강점인 빠른 속도와 비용 효율성을 유지하면서도 추론 능력을 대폭 향상시킨 것이 특징이다. 구글은 이 모델이 뛰어난 성능 대비 비용 효율성을 갖추고 있어, 개발자들에게 매력적인 선택지가 될 것이라고 강조했다.
특히 Gemini 2.5 Flash는 구글 최초의 완전한 하이브리드 추론(hybrid reasoning) 모델이라는 점에서 주목받는다. 이 기능을 통해 개발자는 모델의 '생각하기(thinking)' 기능을 켜거나 끌 수 있으며, '생각 예산(thinking budgets)'을 설정하여 응답 품질, 비용, 지연 시간(latency) 간의 균형을 최적화할 수 있다. '생각하기' 기능을 끈 상태에서도 개발자들은 기존 2.0 Flash의 속도를 유지하면서도 향상된 성능을 경험할 수 있다.

Gemini 2.5 Flash 주요 특징
모델 | 특징설명 |
주요 개선 사항 | 기존 2.0 Flash 기반, 추론 능력 대폭 향상 |
핵심 기능 | 하이브리드 추론: '생각하기' 기능 On/Off, '생각 예산' 설정 가능 |
강점 | 뛰어난 성능 대비 비용 효율성, 빠른 속도 |
사용 가능 플랫폼 | Gemini API (Google AI Studio, Vertex AI), Gemini 앱 |
활용 예시 | Gemini 앱 내 Canvas 기능 등과 연동하여 문서 및 코드 작업 개선 |
Gemini 2.5 Flash는 개발자뿐만 아니라 일반 사용자들도 Gemini 앱을 통해 경험할 수 있다. 또한, 사용자가 문서나 코드를 다듬을 수 있는 대화형 공간인 '캔버스(Canvas)'와 같은 새로운 기능과 함께 사용될 수 있어 활용성이 더욱 높아질 것으로 기대된다.
구글은 이번 프리뷰 버전을 통해 개발자 및 사용자들의 피드백을 적극적으로 수렴하여 모델을 더욱 개선해 나갈 계획이다. 개발자들은 Gemini 2.5 Flash를 활용하여 다양한 애플리케이션을 구축하고, 구글은 이를 통해 실제 사용 환경에서의 모델 성능과 유용성을 검증할 수 있을 것이다.
이번 Gemini 2.5 Flash 출시는 AI 모델 개발에서 성능뿐만 아니라 속도, 비용 효율성, 개발 유연성 등 다양한 요소를 균형 있게 고려하는 최신 트렌드를 반영한다. 특히 사용자가 직접 모델의 추론 과정을 제어할 수 있는 하이브리드 추론 기능은 향후 AI 모델 개발 방향에 새로운 기준을 제시할 가능성이 있다.
구글은 "Gemini 2.5 Flash가 개발자들의 앱에서 어떻게 활용될지 기대하며, 사용자들의 피드백을 기다린다"고 밝혔다.
Gemini Developer API | Gemma open models | Google AI for Developers
Build with Gemini 2.0 Flash, 2.0 Pro, and Gemma using the Gemini API and Google AI Studio.
ai.google.dev
'IT' 카테고리의 다른 글
ChatGPT, 이제 '기억'으로 웹 검색도 맞춤 설정 (0) | 2025.04.19 |
---|---|
나만의 AI 이메일 비서 만들기: GPT 4.1과 N8N 활용 가이드 (1) | 2025.04.18 |
OpenAI, 'Flex 처리' API 출시... 비용 절반↓, 속도는 ↓ (0) | 2025.04.18 |
퍼플렉시티 AI, 삼성·모토로라 스마트폰 탑재 눈앞… 구글 아성에 도전 (0) | 2025.04.18 |
Kling AI 2.0 출시: 멀티모달 편집 기능으로 AI 스토리텔링의 새 지평 열어 (0) | 2025.04.18 |