반응형
Gemini 3.1 시리즈 최경량 버전 → 대규모 에이전트·엣지·저지연 작업 특화

구글이 3월 3일 Gemini API와 Google AI Studio를 통해 ‘Gemini 3.1 Flash-Lite’를 프리뷰 출시했다. 이는 Gemini 3.1 Flash보다 더 가볍고 빠르며 비용 효율적인 모델로, 입력 100만 토큰당 0.25달러, 출력 1.50달러라는 파격적인 가격을 책정했다(기존 Flash 대비 약 1/4~1/8 수준).
반응형
주요 강점은 극단적인 저지연 + 고속 출력으로, 번역·콘텐츠 모더레이션·UI 생성·시뮬레이션·대량 데이터 추출 등 고볼륨·에이전트 워크로드에 최적화됐다. 지식 컷오프는 2025년 1월이며, 멀티모달(텍스트+이미지) 네이티브 지원도 유지한다. 개발자들은 즉시 Google AI Studio에서 테스트 가능하며, 기업은 Vertex AI를 통해 도입할 수 있다.
이 모델은 구글이 비용·속도·성능 3박자를 모두 잡으려는 전략의 일환으로 보이며, 엣지 AI와 모바일·임베디드 환경 확대의 신호탄으로 해석된다.
출처: Google Blog, Google AI for Developers, DeepMind Model Card, VentureBeat (2026.03.03~04)
반응형
'IT' 카테고리의 다른 글
| 이세돌 9단, 인핸스 에이전틱 AI와 '알파고' 10년 만에 재대국 (0) | 2026.03.05 |
|---|---|
| 삼성전자, '갤럭시 S26'에 퍼플렉시티 AI 기본 탑재…'멀티 에이전트' 생태계로 패러다임 전환 (0) | 2026.02.24 |
| 액센추어, 승진 조건에 “AI 도구 주간 사용 필수” 도입… 78만 직원 AI 전환 총력 (0) | 2026.02.21 |
| 구글, Gemini 3.1 Pro 대대적 업그레이드… 'Deep Think' 모드로 과학·수학·복잡 추론 최강자 등극 (0) | 2026.02.21 |
| 중국 MiniMax, M2.5 / M2.5 Lightning 공개 (0) | 2026.02.18 |