자체 기억 압축 기술 ‘컴팩션’ 첫 적용…긴 호흡 업무 최적화
벤치마크 77.9% 달성…구글 ‘제미나이 3’ 제쳐

오픈AI가 복잡한 엔지니어링 과제를 24시간 이상 연속으로 수행할 수 있는 새로운 AI 모델 ‘GPT-5.1-코덱스 맥스(GPT-5.1-Codex-Max)’를 19일(현지시간) 출시했다.
이번 모델은 오픈AI의 최신 ‘GPT-5.1’ 시리즈의 일환으로, 긴 호흡이 필요한 소프트웨어 개발 업무에 특화된 ‘에이전트형 코딩 모델’이다. 기존 모델들이 문맥(Context) 용량 제한으로 장시간 작업 시 기억을 잃거나 성능이 저하되던 문제를 기술적으로 해결했다.
오픈AI는 이번 모델에 처음으로 ‘컴팩션(Compaction)’이라는 독자적인 기억 압축 기술을 적용했다. 이 기술은 AI가 대화 기록을 스스로 정리해 불필요한 정보는 쳐내고 핵심 맥락만 보존하게 한다. 이를 통해 수백만 토큰에 달하는 정보를 처리하면서도 프로젝트의 전체 상태를 유지할 수 있어, 하루가 꼬박 걸리는 엔지니어링 작업도 자율적으로 수행 가능하다.
성능 지표에서도 경쟁사를 앞섰다. 실제 깃허브(GitHub) 이슈 해결 능력을 평가하는 ‘SWE-벤치 베리파이드(SWE-bench Verified)’ 테스트에서 코덱스 맥스는 77.9%의 점수를 기록했다. 이는 이전 버전인 GPT-5.1-코덱스(73.1%)는 물론, 최근 구글이 발표한 ‘제미나이 3(Gemini 3, 76.2%)’를 상회하는 수치다.
코덱스 맥스는 현재 챗GPT 플러스(Plus), 프로(Pro), 기업용(Enterprise) 등 유료 구독자들에게 ‘코덱스’ 환경의 기본 모델로 제공된다. 또한 코덱스 CLI(명령줄 인터페이스)를 통해 즉시 사용할 수 있으며, 조만간 API로도 출시될 예정이다.
이번 출시는 구글과 앤스로픽 등 경쟁사들이 앞다퉈 코딩 특화 AI를 내놓는 상황에서 기술적 우위를 재확인하려는 전략으로 풀이된다. 오픈AI 측은 “새로운 토큰 효율화 기술을 통해 추론 비용은 낮추면서도 더 긴 작업을 더 정확하게 수행할 수 있게 됐다”고 설명했다.
참고출처: https://openai.com/index/gpt-5-1-codex-max/https://the-decoder.com/openai-releases-gpt-5-1-codex-max-to-handle-engineering-tasks-that-span-twenty-four-hours/
'IT' 카테고리의 다른 글
| 구글, ‘제미나이 3’ 전격 공개… “압도적 성능으로 1위 탈환” (0) | 2025.11.19 |
|---|---|
| "2년 내 범죄 '0' 만들겠다"… 돌아온 Ring 창업자의 파격 선언, 현실일까 망상일까? (0) | 2025.11.19 |
| 구글, AI 항공권 검색 '플라이트 딜' 전 세계 확대…한국 포함 (0) | 2025.11.18 |
| 구글 검색, AI가 여행 계획부터 예약까지…'AI 모드' 도입 (0) | 2025.11.18 |
| 구글, AI 기상예측 모델 'WeatherNext 2' 공개…"8배 빨라져" (0) | 2025.11.18 |