단순 코딩 넘어 ‘스스로 구축’하는 AI 등장…
개발자 역할 ‘감독’으로 변화 예고

인공지능(AI)이 인간의 개입 없이 스스로 소프트웨어를 개발하고 오류를 수정하는 ‘자율 에이전트(Autonomous Agent)’ 시대가 열렸다. 지난 5일(현지시간) 오픈AI와 앤스로픽이 동시에 차세대 모델을 공개하며 기술 패권 경쟁이 새로운 국면에 접어들었다.
◇ 오픈AI GPT-5.3-Codex, “AI가 AI를 만들다”
오픈AI가 공개한 ‘GPT-5.3-Codex’는 현존하는 가장 강력한 에이전트 기반 코딩 모델로 평가받는다. 이전 버전인 GPT-5.2-Codex 대비 작업 속도가 25% 향상되었으며, 추론 능력과 전문 지식 처리 능력이 대폭 강화됐다.
가장 눈에 띄는 특징은 ‘자기 생성(Self-building)’ 능력이다. 오픈AI 개발팀은 이 모델을 사용해 모델 자체의 훈련 데이터를 디버깅하고 배포 관리를 수행했다고 밝혔다. AI가 자신의 성능을 개선하는 데 직접 기여한 첫 사례다.
이 모델은 ‘SWE-Bench Pro’ 벤치마크에서 업계 최고인 56.8%의 정확도를 기록했다. 단순한 코드 생성을 넘어 복잡한 게임이나 애플리케이션을 며칠에 걸쳐 처음부터 끝까지 구축할 수 있는 능력을 갖췄다. 오픈AI 측은 “개발자의 역할이 직접 코드를 작성하는 것(Coder)에서 AI를 관리·감독하는 것(Supervisor)으로 변화할 것”이라고 전망했다.
◇ 앤스로픽 클로드 4.6, “팀으로 일하는 AI”
같은 날 앤스로픽은 기업 업무 환경에 최적화된 ‘클로드 오퍼스 4.6(Claude Opus 4.6)’을 출시하며 맞불을 놨다. 이 모델은 ‘신뢰성’과 ‘협업’에 방점을 찍었다.
클로드 4.6의 핵심 기능인 ‘에이전트 팀(Agent Teams)’은 여러 AI 에이전트가 각자의 역할을 맡아 병렬로 업무를 처리하는 기술이다. 예를 들어 한 에이전트가 코드를 작성하면, 다른 에이전트가 이를 검수하고 보안 취약점을 점검하는 식이다.
또한 100만(1M) 토큰의 컨텍스트 윈도우(Context Window)를 지원해 방대한 분량의 문서를 한 번에 분석할 수 있다. 앤스로픽은 “금융 분석, 법률 검토 등 고도의 정확성이 요구되는 작업에서 인간 전문가 수준의 추론 능력을 보여준다”고 설명했다.
업계 전문가들은 이번 동시 출시가 기업용 AI 시장의 판도를 뒤흔들 것으로 보고 있다. 마이크로소프트의 깃허브 코파일럿(GitHub Copilot)과 스노우플레이크(Snowflake) 등 주요 플랫폼은 이미 해당 모델들의 통합을 서두르고 있다.
'IT' 카테고리의 다른 글
| 캔바(Canva), AI 어시스턴트에 '브랜드 디자인' 직접 통합 (0) | 2026.02.08 |
|---|---|
| 오픈소스 AI 에이전트 '오픈클로(OpenClaw)', 보안 취약점 노출: AI 생태계의 '판도라의 상자' 열리나 (0) | 2026.02.08 |
| "AI 주권 지킨다"… 韓 독자 파운데이션 모델 경쟁 '점화' (0) | 2026.02.03 |
| 구글, 크롬 브라우저에 제미나이 탑재… AI 네이티브 브라우저 시대 개막 (0) | 2026.02.03 |
| 구글 딥마인드, 획기적인 유전체 AI 모델 'AlphaGenome' 공개 (0) | 2026.02.03 |