생각하는 AI, 100만 토큰 처리 능력으로 새 시대 열어
안전성 보고서 미공개로 비판 직면, 가격 정책도 논란
구글이 3월 말 자사 AI 모델 중 가장 강력한 Gemini 2.5 Pro를 출시했다. '생각하는 모델(thinking model)'로 불리는 이 AI는 응답 전 추론 과정을 거쳐 정확도를 높인 것이 특징이다. 특히 코딩, 수학, 과학 분야 벤치마크 테스트에서 경쟁사 모델들을 압도하는 성능을 보여주며 AI 기술 경쟁에서 구글의 입지를 강화했다.
"Gemini 2.5 Pro는 복잡한 문제를 분석하고, 논리적 결론을 도출하며, 맥락과 뉘앙스를 고려해 정보에 기반한 결정을 내리는 능력을 갖추고 있습니다"라고 구글은 공식 블로그를 통해 밝혔다.
압도적 성능의 차세대 AI 모델
이번에 출시된 Gemini 2.5 Pro는 무엇보다 100만 토큰(약 75만 단어)의 컨텍스트 윈도우를 자랑한다. 이는 '반지의 제왕' 시리즈 전체보다 긴 분량으로, 기존 OpenAI의 o3-mini(20만 토큰), Claude 3.7 Sonnet(20만 토큰) 등 경쟁 모델들을 크게 앞서는 수치다. 구글은 향후 이를 200만 토큰으로 확장할 계획이라고 밝혔다.
Gemini 2.5 Pro는 여러 벤치마크 테스트에서도 우수한 성능을 입증했다. 특히 수학과 과학 분야에서 인상적인 결과를 보였다.
주요 벤치마크 성능 비교
벤치마크 | Gemini 2.5 Pro | 경쟁 모델 최고 성능 |
AIME 2025 (수학) | 86.7% | o3-mini: 86.5% |
GPQA Diamond (과학) | 84.0% | Grok 3 Beta: 80.2% |
SWE-Bench Verified (코딩) | 63.8% | Claude 3.7: 70.3% |
MRCR (128K 컨텍스트) | 91.5% | GPT-4.5: 48.8% |
출처: Google
이 모델은 텍스트뿐 아니라 오디오, 이미지, 동영상 등 다양한 형태의 입력을 처리할 수 있는 멀티모달 능력을 갖추고 있으며, 특히 코드 생성 및 웹 개발 분야에서 강점을 보인다.
Wandb의 분석에 따르면 "Gemini 2.5 Pro는 이전 모델인 Gemini 2.0 Flash보다 정확도 점수가 0.8로 크게 향상되었으나, 토큰 사용량은 상당히 증가했다"고 보고했다.
가격 정책과 접근성
4월 초 공개된 Gemini 2.5 Pro의 API 가격은 구글이 제공하는 AI 모델 중 가장 비싼 수준이다. 20만 토큰 이하의 프롬프트에 대해 입력 토큰 100만 개당 $1.25, 출력 토큰 100만 개당 $10을 책정했다. 20만 토큰을 초과하는 경우에는 입력 토큰 100만 개당 $2.50, 출력 토큰 100만 개당 $15로 가격이 상승한다.
이는 구글의 다른 모델인 Gemini 2.0 Flash(입력 토큰 100만 개당 $0.10, 출력 토큰 100만 개당 $0.40)보다 상당히 비싸지만, OpenAI의 GPT-4.5(입력 토큰 100만 개당 $75, 출력 토큰 100만 개당 $150)와 같은 최상위 경쟁 모델과 비교하면 경쟁력 있는 가격이다.
현재 Gemini 2.5 Pro는 Google AI Studio와 Gemini Advanced 사용자들이 이용할 수 있으며, Google Cloud의 Vertex AI에도 곧 제공될 예정이다.
안전성 문제와 비판
그러나 이러한 기술적 성과에도 불구하고, 구글은 Gemini 2.5 Pro 출시 시 안전성 보고서(모델 카드 또는 시스템 카드)를 공개하지 않아 비판을 받고 있다.
Fortune의 보도에 따르면, 이는 2023년 7월 당시 바이든 행정부가 소집한 백악관 회의에서 구글을 포함한 주요 AI 기업들이 서명한 약속을 위반한 것이라고 지적했다.
당시 기업들은 "최첨단 수준을 넘어서는 주요 공개 모델 출시 시 모두 보고서를 발표하겠다"고 약속했으며, 여기에는 "수행된 안전성 평가, 성능의 중대한 제한점, 공정성과 편향성과 같은 사회적 위험에 대한 모델의 영향, 그리고 모델의 배포 적합성을 평가하기 위해 수행된 적대적 테스트 결과"를 포함해야 한다는 내용이 담겨 있었다.
옥스포드 인터넷 연구소의 Sandra Wachter 교수는 "책임감 있는 연구와 혁신은 시스템의 능력에 대해 투명하게 공개하는 것을 의미한다"며 "이것이 자동차나 비행기였다면, '가능한 한 빨리 시장에 내놓고 나중에 안전 측면을 살펴보자'라고 말하지 않을 것"이라고 지적했다.
구글은 Gemini 2.5 Pro가 단순한 챗봇을 넘어 웹 애플리케이션 개발, 코드 변환 및 편집, 대규모 데이터셋 분석 등 다양한 분야에서 활용될 수 있을 것으로 전망하고 있다.
또한 구글은 Gemini 2.5 Flash라는 저비용 고효율 모델도 곧 출시할 예정이라고 밝혔다. 이는 Flash 모델에도 '생각하는 능력'을 도입해 구글의 모든 Gemini 모델이 적응적 사고 능력을 갖추게 한다는 비전의 일부다.
AI 산업 경쟁이 심화되는 가운데, 구글의 이번 Gemini 2.5 Pro 출시는 OpenAI, Anthropic 등 경쟁사와의 기술 격차를 좁히고 선도적 위치를 확보하려는 중요한 행보로 평가된다.
참고링크
'IT' 카테고리의 다른 글
AI 기술로 피부암 진단 혁신, 영국 NHS 병원에서 성공적 도입 (0) | 2025.04.15 |
---|---|
"구글 클래스룸, AI 퀴즈 문제 생성 기능 도입...교사들의 업무 효율성 높인다" (0) | 2025.04.15 |
마이크로소프트, 차세대 AI 모델 'GPT-4.1' 시리즈 공개 (0) | 2025.04.15 |
캔바, 창립 이래 최대 규모 업데이트 'Visual Suite 2.0' 공개 (1) | 2025.04.14 |
AI 스타트업의 새로운 도전, '대기업과의 게임'에서 승리하는 법 (1) | 2025.04.14 |