코딩·에이전트 성능 ‘압도적’… 오픈AI GPT-5.1 제쳐
복잡한 업무 스스로 해결… 개발자·기업 생산성 혁신 예고
앤스로픽(Anthropic)이 자사 인공지능(AI) 모델 중 가장 강력한 성능을 자랑하는 ‘클로드 오퍼스 4.5(Claude Opus 4.5)’를 전격 출시했다. 이번 모델은 코딩과 복잡한 추론, 자율 에이전트 작업에서 현존 최고 수준의 성능을 입증하며 AI 기술 경쟁의 새로운 지평을 열었다는 평가다.
AI 지능의 새 표준… 코딩·에이전트 특화
앤스로픽은 지난 24일(현지시간) 클로드 오퍼스 4.5를 공개하며 “지금까지 개발된 모델 중 가장 지능적인 모델”이라고 밝혔다. 오퍼스 4.5는 특히 소프트웨어 엔지니어링과 복잡한 컴퓨터 작업 자동화(Computer Use) 분야에서 독보적인 성능을 보인다.
실제 소프트웨어 엔지니어링 능력을 평가하는 ‘SWE-벤치(SWE-bench Verified)’ 테스트에서 오퍼스 4.5는 80.9%의 정확도를 기록했다. 이는 경쟁 모델인 오픈AI의 ‘GPT-5.1 코덱스 맥스(GPT-5.1 Codex Max, 77.9%)’와 구글 ‘제미나이 3 프로(Gemini 3 Pro, 76.2%)’를 모두 따돌린 수치다.

스스로 생각하고 해결하는 ‘에이전트’
오퍼스 4.5의 핵심은 모호한 지시에도 스스로 판단해 업무를 수행하는 ‘에이전트(Agentic)’ 능력이다. 앤스로픽 내부 테스트 결과, 이 모델은 복잡한 다중 시스템 버그를 인간의 개입 없이 스스로 진단하고 수정하는 데 성공했다.
아담 울프(Adam Wolff) 앤스로픽 관계자는 “오퍼스 4.5는 20~30분 동안 자율적으로 코딩 작업을 수행할 수 있다”며 “잠깐 자리를 비운 사이 AI가 완벽하게 업무를 처리해 놓는 미래가 현실이 됐다”고 설명했다.
클라우드 전면 개방… 가격 효율성 높여
새 모델은 앤스로픽 API와 아마존 베드락(Amazon Bedrock), 구글 클라우드 버텍스 AI(Google Cloud Vertex AI) 등 주요 클라우드 플랫폼에서 즉시 사용할 수 있다. 마이크로소프트 애저(Azure)와의 파트너십을 통해 애저 플랫폼에서도 제공된다.
이용 가격은 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 25달러로 책정됐다. 이는 이전 모델 대비 토큰 효율성을 높여, 기업이 더 적은 비용으로 고도화된 작업을 처리할 수 있도록 설계됐다.
2025년 라인업 완성… 시장 판도 흔든다
앤스로픽은 지난 9월 ‘클로드 소넷 4.5(Claude Sonnet 4.5)’, 10월 ‘클로드 하이쿠 4.5(Claude Haiku 4.5)’를 잇달아 선보인 데 이어, 이번 오퍼스 4.5 출시로 2025년형 모델 라인업을 완성했다.
업계 전문가들은 “오퍼스 4.5가 보여준 코딩과 추론 능력은 단순한 보조 도구를 넘어, 엔지니어링 업무 자체를 대체할 가능성을 보여준다”고 분석했다.
[출처]
Anthropic(2025.11.24). Introducing Claude Opus 4.5. https://www.anthropic.com/news/claude-opus-4-5
'IT' 카테고리의 다른 글
| '노트북도 식별' 아리랑 7호 발사 성공…우주강국 도약 (0) | 2025.12.02 |
|---|---|
| 중국 딥시크(DeepSeek), 오픈소스 'V3.2' 공개… "GPT-5·제미나이 3 프로와 대등, 수학 올림피아드 금메달 수준" (0) | 2025.12.02 |
| 알리바바, 2시간짜리 영상 꿰뚫는 AI ‘Qwen3-VL’ 공개… “GPT-5·제미나이 넘었다” (0) | 2025.11.30 |
| 텐센트, 소비자용 GPU서 돌아가는 ‘훈위안비디오 1.5’ 오픈소스 공개 (0) | 2025.11.26 |
| 구글 TPU, 엔비디아 독점 흔드나 (0) | 2025.11.26 |