높은 정확성 대가로 느린 응답 속도와 비싼 비용 논란
인공지능(AI) 기업 OpenAI가 오늘(6일) DevDay 이벤트에서 플래그십 모델인 'GPT-5 Pro'를 API 전용으로 공식 출시하며 대규모 언어 모델(LLM) 시장에 새로운 표준을 제시했다.
GPT-5 Pro는 GPT-5와 동일하게 2024년 9월 30일 지식 차단점과 40만 토큰의 컨텍스트 한도를 공유하지만, 최대 출력 토큰을 기존 128,000개에서 272,000개로 대폭 늘린 것이 특징이다. 이 모델은 OpenAI의 가장 진보된 추론 모델로, 'reasoning.effort: high' 설정을 기본이자 유일한 옵션으로 채택해 복잡한 문제에 대한 최고 수준의 추론 능력을 제공하는 데 집중한다.
느린 응답 속도와 높은 가격, 실사용 효율성 '도마 위'
그러나 이 고성능 모델은 극단적으로 느린 응답 속도와 높은 비용이라는 장벽에 부딪혔다. 한 초기 사용자(Simon Willison)의 테스트에 따르면, '자전거 타는 펠리컨의 SVG 생성'이라는 간단한 요청에 6분 8초가 소요되었다.
비용 측면에서도, 이 응답은 16개 입력 토큰과 9,205개 출력 토큰을 사용해 $1.10(약 1,500원)이 청구되었다. GPT-5 Pro의 가격 정책은 입력 토큰 100만 개당 $15, 출력 토큰 100만 개당 $120로 책정되어, 기존 GPT-5 모델 대비 상당한 가격 인상을 보였다. 이처럼 높은 지연 시간과 비용은 대량 사용이 필수적인 일반 기업 환경에서의 실효성 논란을 불러일으킬 전망이다.
OpenAI는 이 모델이 현재까지는 오직 Responses API를 통해서만 접근 가능하며, 기존 라이브러리가 아닌 별도의 llm-openai-plugin
업데이트를 통해서만 지원됨을 밝혔다. 이는 새로운 추론 모델이 기존 워크플로우에 통합되는 데 시간이 걸릴 것임을 시사한다.
출처: OpenAI 모델 공식 문서 및 Simon Willison 개인 블로그(2025년 10월 6일)
'IT' 카테고리의 다른 글
삼성, 700만 매개변수 '초소형 AI' TRM 개발…거대 모델 능가하는 추론 능력 (0) | 2025.10.11 |
---|---|
앤트로픽 ‘클로드 소넷 4.5’, 보안 취약점 탐지 25%↑ (0) | 2025.10.06 |
알리바바, Qwen3 컴팩트 멀티모달 모델 공개…GPT-4o 등과 경쟁 (0) | 2025.10.05 |
OpenAI, 삼성·SK와 ‘스타게이트’ 동맹…5천억 달러 AI 인프라 구축 가속 (0) | 2025.10.05 |
구글, 제미나이 2.5 플래시 이미지 일반 공개...10가지 화면 비율 지원 확대 (0) | 2025.10.05 |