본문 바로가기

코딩AI6

OpenAI, ‘GPT-5.2’ 기습 출시… 구글 제미나이 3 꺾고 ‘왕좌 탈환’ GPT-5.1 출시 4주 만에 성능 경신… 추상적 추론·코딩서 압도적 우위‘전문가급 지식 노동’ GDPval 70.9% 달성… 프로 버전 가격은 대폭 상승 OpenAI가 최신 AI 모델 ‘GPT-5.2’를 전격 공개하며 구글 ‘제미나이 3(Gemini 3)’에게 내줬던 왕좌를 4주 만에 되찾았다. 특히 추상적 추론과 코딩 능력에서 비약적인 성능 향상을 보이며 ‘전문가급 지식 노동’이 가능한 첫 모델이라는 평가를 받고 있다. OpenAI는 11일(현지시간) 자사 블로그를 통해 “전문적인 지식 노동을 위한 역대 가장 유능한 모델 시리즈인 GPT-5.2를 출시한다”고 밝혔다. 이번 출시는 전작인 GPT-5.1을 선보인 지 불과 4주 만에 이루어진 것으로, 구글의 제미나이 3 프로(Gemini 3 Pro)가 보.. 2025. 12. 12.

오픈AI ‘코덱스 맥스’ 출시…“24시간 연속 코딩” 자체 기억 압축 기술 ‘컴팩션’ 첫 적용…긴 호흡 업무 최적화벤치마크 77.9% 달성…구글 ‘제미나이 3’ 제쳐 오픈AI가 복잡한 엔지니어링 과제를 24시간 이상 연속으로 수행할 수 있는 새로운 AI 모델 ‘GPT-5.1-코덱스 맥스(GPT-5.1-Codex-Max)’를 19일(현지시간) 출시했다.이번 모델은 오픈AI의 최신 ‘GPT-5.1’ 시리즈의 일환으로, 긴 호흡이 필요한 소프트웨어 개발 업무에 특화된 ‘에이전트형 코딩 모델’이다. 기존 모델들이 문맥(Context) 용량 제한으로 장시간 작업 시 기억을 잃거나 성능이 저하되던 문제를 기술적으로 해결했다. 오픈AI는 이번 모델에 처음으로 ‘컴팩션(Compaction)’이라는 독자적인 기억 압축 기술을 적용했다. 이 기술은 AI가 대화 기록을 스스로.. 2025. 11. 20.

앤트로픽 ‘클로드 소넷 4.5’, 보안 취약점 탐지 25%↑ 자율 패치 에이전트 구축 가능...취약점 대응 시간 44% 단축SWE-bench 77.2% 달성, 코딩 및 에이전트 분야 최고 성능 입증 AI 전문 기업 앤트로픽(Anthropic)이 신규 대규모 언어 모델(LLM)인 ‘클로드 소넷 4.5’를 공개하며 사이버 보안 분야에서 혁신적인 성과를 발표했다. 이 모델은 특히 보안 취약점 탐지 정확도를 25% 높였으며, 평균 취약점 처리 시간을 44% 단축해 기업의 선제적 방어 체계를 강화할 전망이다. 클로드 소넷 4.5는 향상된 하이브리드 추론(Hybrid Reasoning) 능력을 바탕으로 취약점이 악용되기 전에 자율적으로 패치하는 에이전트 구축을 가능하게 한다. 이는 기존의 사후 대응적 탐지 방식을 넘어 능동적인 보안 강화를 지원하는 중요한 발전으로 평가받는다.. 2025. 10. 6.

앤트로픽, AI 안전성과 코딩 AI 시장 선도 기업가치 236조원 돌파 OpenAI 출신 창업·기업가치 236조원·코딩 AI 분야 42% 독주·'해석 가능한 AI' 기술 선도 앤트로픽(Anthropic)이 'AI 안전'이라는 철학을 바탕으로 생성형 AI 시장에서 빠르게 성장하며 OpenAI의 강력한 경쟁자로 부상하고 있다. 2021년 1월 OpenAI 출신 핵심 인물들이 설립한 이 미국 샌프란시스코 기반 기업은, CEO 다리오 아모데이와 CTO 다니엘라 아모데이를 중심으로 한 창업팀이 "AI 안전에 대한 철학적 갈등"으로 OpenAI를 떠나 설립했다. 회사의 법적 형태인 PBC(Public Benefit Corporation)는 사회적 책임을 사업적 우선순위로 삼겠다는 의지를 보여준다.시장 점유율 및 성과 지표구분앤트로픽 (클로드)OpenAI (GPT)기타기업용 LLM 시장.. 2025. 8. 5.

Anthropic, 차세대 AI 모델 ‘Claude 4’ 공개…AI 에이전트 시대 본격화 “코딩·문서작성·복잡업무까지”…Claude Opus 4, AI 활용의 새 표준 제시아마존 등 대형 투자자 주목…AI 시장 경쟁 구도 재편 신호탄 Anthropic(앤트로픽)이 2025년 5월 22일, 자사의 최신 인공지능 모델 ‘Claude 4’ 시리즈를 공식 발표했다. 이번 신제품은 복잡한 데이터 분석, 장시간 업무 자동화, 고품질 코딩 등에서 기존 AI 한계를 뛰어넘으며, 글로벌 AI 시장의 경쟁 구도에 중대한 변화를 예고했다. 미국 AI 스타트업 Anthropic이 5월 22일(현지시간) ‘Claude 4’ 시리즈를 공개했다. 이번에 발표된 ‘Claude Opus 4’와 ‘Claude Sonnet 4’는 각각 “AI 에이전트의 새로운 표준”을 제시하며, 수천 개의 데이터 소스 분석, 장시간 연속 작.. 2025. 5. 23.

딥시크 R2, AI 산업에 ‘두 번째 쇼크’ 예고 GPT-4 대비 2.7% 수준 초저가1.2조 파라미터·다국어·코딩 능력 대폭 강화 중국 AI 스타트업 딥시크(DeepSeek)가 차세대 인공지능 언어모델 ‘딥시크 R2(DeepSeek R2)’를 2025년 4월 말~5월 초 조기 출시한다. 이번 신모델은 1.2조 파라미터의 대형 모델로, 오픈AI GPT-4 터보 대비 토큰당 가격이 2.7%에 불과하며, 코드 생성과 다국어 추론 능력이 대폭 강화된 것이 특징이다. 딥시크는 화웨이 AI칩 기반의 독자적 아키텍처를 활용해 글로벌 AI 시장 판도 변화를 노리고 있다.딥시크 R2 주요 특징 및 경쟁력딥시크 R2는 하이브리드 전문가 혼합(MoE) 3.0 아키텍처와 1.2조 파라미터를 탑재해 기존 R1 대비 두 배 이상 성능을 높였다. 특히, GPT-4 터보의 입력 .. 2025. 4. 30.

이전 1 다음

티스토리툴바