본문 바로가기
IT

OpenAI, ‘GPT-5.2’ 기습 출시… 구글 제미나이 3 꺾고 ‘왕좌 탈환’

by 카메라의눈 2025. 12. 12.
반응형
GPT-5.1 출시 4주 만에 성능 경신… 추상적 추론·코딩서 압도적 우위
‘전문가급 지식 노동’ GDPval 70.9% 달성… 프로 버전 가격은 대폭 상승

OpenAI, ‘GPT-5.2’ 기습 출시… 구글 제미나이 3 꺾고 ‘왕좌 탈환’
by. Nano Banana

 

OpenAI가 최신 AI 모델 ‘GPT-5.2’를 전격 공개하며 구글 ‘제미나이 3(Gemini 3)’에게 내줬던 왕좌를 4주 만에 되찾았다. 특히 추상적 추론과 코딩 능력에서 비약적인 성능 향상을 보이며 ‘전문가급 지식 노동’이 가능한 첫 모델이라는 평가를 받고 있다.

 

OpenAI는 11일(현지시간) 자사 블로그를 통해 “전문적인 지식 노동을 위한 역대 가장 유능한 모델 시리즈인 GPT-5.2를 출시한다”고 밝혔다. 이번 출시는 전작인 GPT-5.1을 선보인 지 불과 4주 만에 이루어진 것으로, 구글의 제미나이 3 프로(Gemini 3 Pro)가 보여준 약진에 대한 즉각적인 대응으로 풀이된다.

 

GPT-5.2는 용도에 따라 ‘인스턴트(Instant)’, ‘싱킹(Thinking)’, ‘프로(Pro)’ 등 세 가지 파생 모델로 제공된다. 샘 알트만 OpenAI CEO는 출시에 맞춰 “우리는 GPT-5.1 이후 먼 길을 왔다”는 짧은 소감을 남기며 자신감을 드러냈다.

 

◇ 추론·코딩 벤치마크서 경쟁사 압도

이번 모델의 가장 큰 특징은 ‘추상적 추론’ 능력의 획기적 개선이다. 추상적 추론 능력을 평가하는 ‘ARC-AGI-2’ 벤치마크에서 GPT-5.2 싱킹(Thinking) 모델은 52.9%의 점수를 기록했다. 이는 전작인 GPT-5.1 싱킹(17.6%)은 물론, 최근 화제를 모았던 구글 제미나이 3 프로의 31.1%를 크게 웃도는 수치다.

 

코딩 능력도 강화됐다. 검증된 소프트웨어 엔지니어링 벤치마크인 ‘SWE-bench Verified’에서 GPT-5.2는 80.0%를 기록해 제미나이 3 프로(76.2%)를 따돌렸다. 과학 퀴즈인 GPQA 다이아몬드(92.4%)와 수학 경시대회 수준인 AIME 2025(100.0%)에서도 경쟁 모델을 앞섰다.

반응형

◇ “전문가 수준 도달”… 비용은 과제

OpenAI는 GPT-5.2가 ‘지식 노동’의 경제적 가치를 측정하는 GDPval 벤치마크에서 70.9%를 달성했다고 강조했다. 이는 GPT-5 싱킹 모델(38.8%) 대비 두 배 가까이 향상된 수치로, AI가 실질적인 전문가 업무를 수행할 수 있는 단계에 진입했음을 시사한다.

 

다만 압도적인 성능만큼 가격 장벽도 높아졌다. 최상위 모델인 ‘GPT-5.2 프로’의 API 가격은 입력 100만 토큰당 21달러, 출력 100만 토큰당 168달러로 책정됐다. 이는 GPT-5.1(입력 1.25달러/출력 10달러)이나 제미나이 3 프로(입력 2달러/출력 12달러)와 비교해 수십 배 비싼 수준이다.

 

업계 관계자는 “구글이 제미나이 3로 치고 나오자 OpenAI가 한 달 만에 더 강력한 모델로 응수하며 AI 경쟁이 ‘속도전’ 양상으로 치닫고 있다”며 “다만 GPT-5.2 프로의 높은 비용은 일반 사용자보다 기업 및 전문 연구용 수요에 집중될 것”이라고 전망했다.

 

 

반응형