본문 바로가기
IT

OpenAI, 추론 능력 강화된 새 AI 모델 o3 및 o4-mini 공개

by 카메라의눈 2025. 4. 17.
반응형
이미지 분석하고 도구 사용하는 차세대 AI… 개발자 위한 가격 경쟁력 확보
치열한 AI 경쟁 속, GPT-5 이전 마지막 독립 추론 모델 될 수도

OpenAI
Image Credits: Jaap Arriens/NurPhoto / Getty Images

 

 

OpenAI가 4월 16일(현지시간) 질문에 답하기 전에 잠시 멈춰 생각하는 과정을 거치는 새로운 인공지능(AI) 추론 모델인 o3o4-mini를 출시했다고 테크크런치(TechCrunch)가 보도했다.

반응형

이번에 공개된 모델 중 o3는 OpenAI의 역대 가장 진보된 추론 모델로, 기존 모델들의 성능을 수학, 코딩, 추론, 과학, 시각 이해 능력 등 다양한 벤치마크 테스트에서 능가하는 것으로 나타났다. 반면 o4-mini는 개발자들이 AI 모델을 선택할 때 중요하게 고려하는 가격, 속도, 성능 사이에서 경쟁력 있는 균형점을 제공하는 데 초점을 맞췄다.

 

특히 이 두 모델은 이전 모델들과 달리 웹 브라우징, 파이썬(Python) 코드 실행, 이미지 처리 및 생성 등 ChatGPT 내의 다양한 도구를 활용하여 응답을 생성할 수 있다는 점이 특징이다. 이 모델들은 응답 신뢰도를 높이기 위해 더 많은 시간을 들여 답변을 만드는 'o4-mini-high' 버전과 함께 OpenAI의 Pro, Plus, Team 구독자에게 우선 제공된다.

 

OpenAI의 이번 신규 모델 출시는 구글, 메타, xAI, 앤스로픽, 딥시크 등과의 치열한 글로벌 AI 경쟁에서 우위를 점하기 위한 전략의 일환이다. OpenAI가 최초로 추론 모델(o1)을 선보인 이후 경쟁사들은 빠르게 유사하거나 더 뛰어난 성능의 모델들을 내놓았으며, 추론 모델은 AI 연구소들이 시스템 성능을 최대한 끌어올리려 하면서 AI 분야의 주류로 부상하고 있다.

 

흥미롭게도 o3 모델은 출시되지 않을 뻔했다. 샘 알트먼 OpenAI CEO는 지난 2월, o3 기술을 통합한 더 정교한 대안 모델 개발에 자원을 집중할 계획임을 시사했으나, 치열한 시장 경쟁 압박 속에서 결국 기존 계획을 변경하여 o3와 o4-mini를 선보인 것으로 보인다.

성능 면에서 o3는 코딩 능력 측정 테스트인 SWE-bench verified에서 69.1%의 점수를 기록하며 최고 수준(state-of-the-art)의 성능을 달성했다. o4-mini 역시 68.1%로 비슷한 수준의 높은 성능을 보였다. 이는 이전 모델인 o3-mini(49.3%)나 경쟁 모델인 앤스로픽의 Claude 3.7 Sonnet(62.3%)보다 높은 점수다.

 

OpenAI는 o3와 o4-mini가 "이미지로 생각할 수 있는" 최초의 모델이라고 강조했다. 사용자는 화이트보드 스케치나 PDF의 다이어그램 같은 이미지를 ChatGPT에 업로드할 수 있으며, 모델은 답변하기 전에 '사고 연쇄(chain-of-thought)' 단계에서 이미지를 분석한다. 이를 통해 흐릿하거나 품질이 낮은 이미지도 이해할 수 있으며, 추론 과정에서 이미지를 확대하거나 회전하는 등의 작업도 수행 가능하다.

 

이미지 처리 능력 외에도 이 모델들은 ChatGPT의 캔버스(Canvas) 기능을 통해 브라우저에서 직접 파이썬 코드를 실행하고, 최신 사건에 대한 질문 시 웹을 검색하여 답변할 수 있다.

표: OpenAI 신규 추론 모델 o3 및 o4-mini 비교

모델 특징 성능 (SWE-bench) 가격 (입력/출력, 백만 토큰 당) 대상
o3 최고 수준의 추론 능력, 이미지 사고 가능 69.1% $10 / $40 고성능 추론 필요 애플리케이션
o4-mini 가격, 속도, 성능 균형 68.1% $1.10 / $4.40 비용 효율적인 범용 애플리케이션

 

개발자들은 Chat Completions API 및 Responses API를 통해 o3, o4-mini, o4-mini-high 세 가지 모델을 모두 사용하여 애플리케이션을 구축할 수 있다. 가격 정책 측면에서 OpenAI는 향상된 성능에도 불구하고 o3를 백만 입력 토큰당 10달러, 백만 출력 토큰당 40달러라는 비교적 낮은 가격에 제공한다. o4-mini는 기존 o3-mini와 동일한 백만 입력 토큰당 1.10달러, 백만 출력 토큰당 4.40달러로 책정되었다.

 

OpenAI는 앞으로 몇 주 안에 더 많은 컴퓨팅 자원을 사용하여 답변을 생성하는 o3 버전인 o3-pro를 ChatGPT Pro 구독자 전용으로 출시할 계획이다.

 

샘 알트먼 CEO는 o3와 o4-mini가 GPT-4.1과 같은 전통적인 모델과 추론 모델을 통합할 것으로 알려진 차세대 모델 GPT-5 이전에 ChatGPT에서 선보이는 마지막 독립형 AI 추론 모델이 될 수 있음을 시사했다.

 

#OpenAI #AI #인공지능 #추론모델 #o3 #o4mini #ChatGPT #GPT5 #이미지분석 #AI경쟁 #API #개발자 #테크크런치

반응형