경쟁 심화 속 비용 절감 카드로 승부수... 비핵심 작업 겨냥
o3·o4-mini 모델 우선 적용, ID 인증 요구 등 부가 조건도
최근 인공지능(AI) 분야의 경쟁이 더욱 치열해지는 가운데, OpenAI가 새로운 API 옵션인 'Flex 처리'를 베타 버전으로 출시했습니다. 이는 AI 모델 사용 비용을 절반으로 낮추는 대신, 응답 속도 지연과 간헐적인 리소스 사용 불가 가능성을 감수한 옵션입니다. 구글 등 경쟁사들의 공세에 대응하고, 증가하는 AI 비용 부담을 완화하려는 전략으로 풀이됩니다.
'Flex 처리'는 현재 OpenAI의 최신 추론 모델인 o3 및 o4-mini에 적용됩니다. OpenAI 측은 이 옵션이 모델 평가, 데이터 보강, 비동기 워크로드 등 우선순위가 낮거나 비(非) 프로덕션 환경의 작업에 적합하다고 설명했습니다.
구체적인 가격 인하 폭은 다음과 같습니다.
- o3 모델:
- 표준: 입력 토큰 1백만 개당 $10, 출력 토큰 1백만 개당 $40
- Flex 처리: 입력 토큰 1백만 개당 $5, 출력 토큰 1백만 개당 $20 (각각 50% 인하)
- o4-mini 모델:
- 표준: 입력 토큰 1백만 개당 $1.10, 출력 토큰 1백만 개당 $4.40
- Flex 처리: 입력 토큰 1백만 개당 $0.55, 출력 토큰 1백만 개당 $2.20 (각각 50% 인하)
이러한 가격 정책은 최근 AI 모델의 가격 경쟁이 심화되는 상황을 반영합니다. 구글은 최근 'Gemini 2.5 Flash'를 출시하며 성능 대비 저렴한 가격을 내세우는 등 경쟁사들의 움직임이 활발합니다. OpenAI의 'Flex 처리'는 이러한 시장 상황에 대응하기 위한 전략적 선택으로 보입니다.
한편, OpenAI는 'Flex 처리' 출시와 함께 특정 사용자 그룹에 대한 정책 변경도 예고했습니다. 사용량 기준 1~3단계(Tier 1-3) 개발자는 o3 모델을 사용하기 위해 새로 도입된 ID 인증 절차를 완료해야 합니다. 또한, o3 및 다른 모델들의 추론 요약 및 스트리밍 API 지원 역시 ID 인증을 거쳐야 이용 가능하게 됩니다. OpenAI는 이러한 ID 인증 절차가 악의적인 사용자의 서비스 정책 위반을 막기 위한 조치라고 설명했습니다.
#OpenAI #Flex처리 #AI #인공지능 #API #비용절감 #o3모델 #o4mini모델 #기술뉴스 #IT뉴스 #AI경쟁 #구글 #Gemini #개발자 #ID인증
'IT' 카테고리의 다른 글
나만의 AI 이메일 비서 만들기: GPT 4.1과 N8N 활용 가이드 (1) | 2025.04.18 |
---|---|
구글, 속도와 추론 능력 균형 맞춘 'Gemini 2.5 Flash' 프리뷰 공개 (0) | 2025.04.18 |
퍼플렉시티 AI, 삼성·모토로라 스마트폰 탑재 눈앞… 구글 아성에 도전 (0) | 2025.04.18 |
Kling AI 2.0 출시: 멀티모달 편집 기능으로 AI 스토리텔링의 새 지평 열어 (0) | 2025.04.18 |
코히어, 복잡한 기업 문서 검색 위한 멀티모달 AI 'Embed 4' 공개 (0) | 2025.04.17 |