단일 GPU로 최고 성능 구현
140개 이상 언어와 멀티모달 지원
구글이 오픈 AI 모델 제품군의 최신작인 'Gemma 3'를 공식 출시했습니다. 2025년 3월 12일 발표된 이 모델은 Gemini 2.0 기술을 기반으로 개발되었으며, 텍스트, 이미지, 짧은 동영상을 처리할 수 있는 멀티모달 기능을 갖추고 있습니다. 모바일 기기부터 강력한 워크스테이션까지 다양한 플랫폼에서 작동하도록 설계된 Gemma 3는 1B, 4B, 12B, 27B 크기의 네 가지 버전으로 제공됩니다.
기술적 특징과 성능
Gemma 3의 가장 주목할 만한 특징은 단일 GPU나 TPU에서 구동 가능하면서도 뛰어난 성능을 제공한다는 점입니다. 구글은 이 모델이 "단일 가속기에서 실행할 수 있는 세계 최고의 모델"이라고 주장하며, LMArena의 인간 선호도 평가에서 Llama-405B, DeepSeek-V3, o3-mini 등의 주요 경쟁 모델을 능가했다고 밝혔습니다.
기술적으로 Gemma 3는 이전 버전에 비해 크게 개선되었습니다. 가장 작은 1B 모델은 32K 토큰의 컨텍스트 윈도우를 지원하며, 나머지 모델들은 모두 128K 토큰까지 처리할 수 있습니다. 또한 SigLIP을 이미지 인코더로 사용해 896x896 픽셀 이미지를 처리하며, 적응형 윈도우 알고리즘을 통해 고해상도 및 비정사각형 이미지도 효과적으로 분석할 수 있습니다.
구글 개발자 블로그는 "지난 출시 이후 Gemma 모델은 1억 회 이상 다운로드되었으며, 커뮤니티에서는 6만 개 이상의 변형을 만들어냈다"고 밝히며 "Gemma 3는 이전 Gemma 릴리스의 성공을 바탕으로 한 가장 강력하고 진보된 버전"이라고 설명했습니다.
언어 지원 및 접근성
Gemma 3의 또 다른 강점은 뛰어난 다국어 지원 기능입니다. 35개 이상의 언어를 즉시 지원하며, 140개 이상의 언어에 대한 사전 훈련 지원을 제공합니다. 특히 새로운 토크나이저는 중국어, 일본어, 한국어 텍스트의 인코딩을 크게 개선했습니다.
접근성 측면에서도 구글은 다양한 경로를 제공합니다. 개발자들은 Google AI Studio에서 브라우저에서 바로 Gemma 3를 사용해볼 수 있으며, Hugging Face, Ollama, Kaggle 등에서 모델을 다운로드할 수도 있습니다. 또한 구글은 학술 연구자들을 위한 'Gemma 3 Academic Program'을 출시하여 연구 가속화를 위한 1만 달러 상당의 Google Cloud 크레딧을 지원합니다.
향후 전망
Gemma 3의 출시는 강력한 AI 모델에 대한 접근성을 높이고 다양한 기기에서의 AI 응용 프로그램 개발을 촉진할 것으로 예상됩니다. 멀티모달 기능과 확장된 컨텍스트 윈도우, 그리고 다국어 지원은 실용적인 AI 솔루션 개발에 큰 도움이 될 것입니다.
구글의 한 관계자는 "Gemma 오픈 모델 제품군은 유용한 AI 기술을 접근 가능하게 만들겠다는 우리의 약속의 기초"라며 "Gemma 3는 더욱 유용하고 접근 가능한 AI를 향한 우리의 여정에서 다음 단계를 나타낸다"고 강조했습니다.
자세한 내용은 구글 개발자 블로그(https://developers.googleblog.com/en/introducing-gemma3/)에서 확인할 수 있습니다.
#GoogleAI #Gemma3 #오픈AI모델 #멀티모달AI #인공지능
'IT' 카테고리의 다른 글
Google Assistant를 Gemini로 대체: 2025년 안드로이드 사용자가 알아야 할 모든 것 (0) | 2025.03.16 |
---|---|
Xbox, 모바일용 AI 게임 코파일럿 출시 예고... "궁극의 게임 파트너" 표방 (0) | 2025.03.14 |
OpenAI, AI 에이전트 개발 혁신 도구 출시 (0) | 2025.03.12 |
플라워 랩스, 2025년 혁신적인 로컬-클라우드 AI 자동 전환 서비스 출시 (0) | 2025.03.12 |
Obsidian 2025: 업무용 무료 전환 완벽 가이드 - 기업도 이제 자유롭게 사용 가능! (0) | 2025.03.12 |