OpenAI의 최신 실험적 언어 모델이 세계에서 가장 권위 있는 수학 대회인 국제수학올림피아드(IMO)에서 금메달 수준의 성과를 달성했다.
OpenAI의 기술 스태프 Alexander Wei는 "우리의 최신 실험적 추론 LLM이 AI의 오랜 과제 중 하나인 세계 최고 권위 수학 대회인 국제수학올림피아드(IMO)에서 금메달 수준의 성능을 달성했다"고 발표했다. 이 모델은 IMO 시험에서 6문제 중 5문제를 정확히 해결했으며, 인간 참가자들과 동일한 테스트 조건에서 평가받았다.
국제수학올림피아드는 1959년 루마니아에서 시작된 세계 최고 권위의 수학 대회로, 기하학 발전에 기여한 Grigori Perelman과 필즈상 수상자 Terence Tao 등 유명한 수학자들이 참가한 대회다. 각 참가자는 4시간 30분 동안 3문제씩 총 6문제를 해결해야 한다.
Terence Tao의 예측을 뒤엎은 AI의 성과
흥미로운 점은 필즈상 수상자 Terence Tao가 6월 Lex Fridman의 팟캐스트에서 AI가 IMO에서 높은 점수를 얻지 못할 것이라고 예측했던 것과 대조된다는 점이다. Tao는 "더 작은 대회들이 있다. 답이 숫자인 대회들도 있다"며 AI 연구자들이 더 낮은 목표를 설정할 것을 제안했다.
하지만 OpenAI의 모델은 이러한 예측을 뒤엎고 IMO에서 금메달 수준의 성과를 달성했다. Wei의 동료 Noam Brown은 "IMO 문제들은 과거 벤치마크에 비해 새로운 수준의 지속적인 창의적 사고를 요구한다"며 "이 모델은 매우 오랫동안 생각한다"고 설명했다.
Wei는 이 모델이 일반 지능의 새로운 영역을 개척했다고 평가했다. "이것은 특정 형식적 수학 시스템이 아닌 LLM이 수학을 하는 것이며, 이는 우리의 일반 지능 추구의 주요 부분이다"라고 설명했다. 이는 DeepMind의 AlphaGeometry와 달리 특별히 수학만을 위해 설계된 시스템이 아니라 일반적인 언어 모델이라는 점에서 의미가 크다.
OpenAI CEO Sam Altman은 "우리가 처음 OpenAI를 시작했을 때 이것은 꿈이었지만 현실적이지 않다고 느꼈다. 이것은 지난 10년간 AI가 얼마나 발전했는지를 보여주는 중요한 표지다"라고 평가했다.
AI의 수학적 추론 능력 향상은 교육 분야에 큰 영향을 미칠 것으로 예상된다. 수학 교육에서 AI가 학생들의 학습을 돕는 도구로 활용될 수 있으며, 복잡한 수학 문제 해결 과정을 단계별로 설명하는 데 활용될 수 있다.
하지만 일부 전문가들은 AI의 수학 능력이 실제로 유용한지에 대해서는 아직 검증이 필요하다고 지적한다. AI 회의론자 Gary Marcus는 "인상적이지만 이 모델의 유용성은 아직 확인되지 않았다"고 평가했다.
OpenAI는 금메달 수준의 능력을 가진 모델이 "수년간" 대중에게 공개되지 않을 것이라고 밝혔다. 이는 AI 기술의 발전 속도와 안전성 고려사항을 반영한 것으로 보인다.
이번 성과는 AI의 일반 지능(AGI) 발전에 있어 중요한 이정표로 평가받고 있다. 특히 수학적 추론 능력은 AI가 복잡한 문제를 해결하는 능력의 핵심 요소로, 향후 AI 기술 발전에 큰 영향을 미칠 것으로 예상된다.
참고 링크:
- Business Insider - OpenAI IMO 금메달 성과
- International Mathematical Olympiad - 공식 웹사이트
- OpenAI - AI 추론 능력 연구
'IT' 카테고리의 다른 글
삼성 갤럭시 언팩 2025, 폴더블 기술 혁신으로 새로운 기준 제시 (0) | 2025.07.20 |
---|---|
Mozilla Firefox 141에 WebGPU 지원 추가... Chrome에 이어 두 번째 브라우저 (1) | 2025.07.20 |
Google AI 'Big Sleep'이 해커들의 SQLite 취약점 사전 차단... (1) | 2025.07.20 |
Netflix, 생성형 AI를 실제 콘텐츠 제작에 활용... 'The Eternaut'에서 건물 붕괴 장면 AI로 제작 (0) | 2025.07.20 |
에이전트형 AI 시장 폭발적 성장... 2025년 전년 대비 300% 증가 (0) | 2025.07.20 |