본문 바로가기

AI모델8

LLM들은 얼마나 클까? (2025년 현황) 대형 언어모델(LLM)의 세계는 2025년 들어 전례 없는 성장과 혁신을 보여주고 있습니다. 시장 규모가 2024년 65억 달러에서 2033년 1,408억 달러로 급성장할 것으로 예상되는 가운데, 각 AI 기업들이 선보이는 모델들의 크기와 성능은 어떻게 달라졌을까요?오늘은 2025년 주요 LLM들의 실제 크기와 성능을 종합적으로 비교해보겠습니다.📊 2025년 주요 LLM 모델 비교🔢 파라미터 수와 모델 크기가장 눈에 띄는 변화는 대부분의 주요 기업들이 파라미터 수를 공개하지 않는다는 점입니다. OpenAI, Anthropic, Google 모두 모델의 정확한 크기를 비공개로 유지하여 경쟁 우위를 보호하고 있습니다.모델명파라미터 수컨텍스트 길이출시일개발사DeepSeek R1671B (37B 활성화)12.. 2025. 7. 3.
새로운 연구, 애플 LLM 추론 능력 저하 연구에 반박 제기 대규모 언어 모델 '추론 붕괴' 현상, 연구 방법론에 의문 제기AI 모델의 안정적 진화 가능성 시사…학계 논의 활발 최근 발표된 한 연구 보고서가 애플(Apple)이 제기했던 대규모 언어 모델(LLM)의 '추론 붕괴(reasoning collapse)' 현상에 대해 반박을 제기하며, AI 모델의 장기적 안정성과 발전 가능성에 대한 학계의 논의를 재점화하고 있다. 이는 AI 모델의 성능 변화를 평가하는 방법론의 중요성을 부각시키며, 관련 연구의 신뢰도에 대한 심층적인 검토를 요구하고 있다.애플의 '추론 붕괴' 연구와 새로운 반박의 배경앞서 애플 연구진은 LLM이 자체 생성한 데이터를 통해 반복적으로 훈련될 경우, 시간이 지남에 따라 '추론 붕괴' 현상이 발생하여 모델의 추론 능력이 저하될 수 있다는 연구 .. 2025. 6. 17.
딥시크 R2, AI 산업에 ‘두 번째 쇼크’ 예고 GPT-4 대비 2.7% 수준 초저가1.2조 파라미터·다국어·코딩 능력 대폭 강화 중국 AI 스타트업 딥시크(DeepSeek)가 차세대 인공지능 언어모델 ‘딥시크 R2(DeepSeek R2)’를 2025년 4월 말~5월 초 조기 출시한다. 이번 신모델은 1.2조 파라미터의 대형 모델로, 오픈AI GPT-4 터보 대비 토큰당 가격이 2.7%에 불과하며, 코드 생성과 다국어 추론 능력이 대폭 강화된 것이 특징이다. 딥시크는 화웨이 AI칩 기반의 독자적 아키텍처를 활용해 글로벌 AI 시장 판도 변화를 노리고 있다.딥시크 R2 주요 특징 및 경쟁력딥시크 R2는 하이브리드 전문가 혼합(MoE) 3.0 아키텍처와 1.2조 파라미터를 탑재해 기존 R1 대비 두 배 이상 성능을 높였다. 특히, GPT-4 터보의 입력 .. 2025. 4. 30.
OpenAI, GPT-4.1 및 소형 모델 출시 예정..."추론 모델도 함께 선보여" 멀티모달 기능 강화된 GPT-4.1과 추론 특화 모델 o3, o4 mini 출시 준비 OpenAI가 차세대 AI 모델인 GPT-4.1과 함께 두 가지 추론 특화 모델 o3, o4 mini를 출시할 예정이라고 The Verge가 보도했다.이번에 출시될 GPT-4.1은 작년 선보인 GPT-4o의 업그레이드 버전으로, 텍스트, 오디오, 이미지를 실시간으로 처리하는 멀티모달 기능이 한층 강화될 전망이다. OpenAI는 이와 함께 'GPT-4.1 mini'와 'GPT-4.1 nano'라는 경량화 버전도 함께 선보일 계획이다. OpenAI는 GPT-4.1 외에도 추론에 특화된 'o3' 모델의 정식 버전과 이의 경량화 버전인 'o4 mini'도 출시를 준비 중이다. 특히 o4 mini가 먼저 출시될 것으로 예상되며,.. 2025. 4. 14.
바이두, AI 모델 ERNIE 4.5 및 ERNIE X1 출시로 중국 AI 경쟁 격화 ERNIE 4.5, 멀티모달 이해 능력 강화ERNIE X1, 딥씽킹 모델로 DeepSeek R1 성능에 도전  중국의 기술 기업 바이두가 2025년 3월 16일, 최신 AI 모델인 ERNIE 4.5와 ERNIE X1을 공개하며 중국 내 AI 경쟁에 불을 지폈다. ERNIE 4.5는 멀티모달 이해 능력을 갖춘 기초 모델로, 텍스트와 이미지, 오디오, 비디오를 통합 처리할 수 있으며, ERNIE X1은 딥씽킹(reasoning) 능력을 강화한 모델로 DeepSeek R1과 유사한 성능을 절반의 비용으로 제공한다.    ERNIE 4.5: 멀티모달 이해의 진화바이두의 최신 기초 모델 ERNIE 4.5는 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터 유형을 통합 처리하는 멀티모달 능력을 갖추고 있다. 이 .. 2025. 3. 17.
메타, 고성능·저비용 'AI 모델 라마 3.3' 공개 기존 405B 모델과 동등 성능..."일반 워크스테이션서도 구동 가능"주커버그 "2025년 라마4 출시...루이지애나에 100억달러 AI센터 건설" 메타(Meta)가 새로운 오픈소스 AI 언어 모델 '라마 3.3(Llama 3.3)'을 공개하며 AI 시장에서 주목을 받고 있다. 이번 모델은 기존 대비 적은 컴퓨팅 파워로도 동등한 성능을 구현해 효율성을 크게 높였다. 혁신적 성능과 효율성라마 3.3은 기존 라마 3.1 405B 모델과 비교해 동등한 성능을 보이면서도 컴퓨팅 자원 소비를 대폭 줄였다. 특히 MMLU, GPQA Diamond, HumanEval 등 주요 벤치마크에서 우수한 성능을 입증했다.주요 기술 스펙컨텍스트 길이: 128k처리 가능 토큰: 15조 개 이상구동 환경: 일반 개발자용 워크스테이.. 2024. 12. 8.