본문 바로가기
반응형

대규모언어모델4

xAI, 플래그십 모델 경량화 'Grok 4 Fast' 공개... 비용 최대 98% 절감 인공지능(AI) 기업 xAI는 주력 모델인 Grok 4의 경량화 버전인 'Grok 4 Fast'를 출시했다고 2025년 9월 20일 밝혔다. 이 모델은 대부분의 작업에서 Grok 4와 동등한 성능을 발휘하면서도 컴퓨팅 자원을 약 40% 덜 사용하며, 작업당 비용을 최대 98%까지 절감할 수 있다는 것이 회사 측의 설명이다. Grok 4 Fast는 기존의 단순 응답 및 추론 중심 작업을 단일 아키텍처로 통합한 것이 특징이다. xAI의 이번 Grok 4 Fast 출시는 플래그십 모델의 성능을 유지하면서도 운영 효율성을 극대화하는 데 중점을 두었다. 회사는 이 모델이 비슷한 결과를 도출하기 위해 평균적으로 **'사고 토큰(thinking tokens)'**을 40% 적게 사용한다고 강조했다. 이는 복잡한 .. 2025. 9. 21.
업스테이지, 310억 매개변수 '솔라 프로 2' 출시 혁신적인 추론 및 다국어 능력으로 기업 시장 정조준한국어 처리 성능 세계 최고 수준…금융, 헬스케어, 법률 분야 특화 인공지능(AI) 스타트업 업스테이지가 310억 개의 매개변수를 가진 대규모 언어 모델(LLM) '솔라 프로 2(Solar Pro 2)'를 공식 출시하며 글로벌 AI 시장에 새로운 이정표를 세웠다. 솔라 프로 2는 고도의 추론 능력, 유연한 도구 활용성, 그리고 뛰어난 다국어 처리 능력을 바탕으로 금융, 헬스케어, 법률 등 다양한 핵심 산업 분야에서 최전선의 성능을 제공하도록 설계되었다. 업스테이지에 따르면, 솔라 프로 2는 한국어 처리 성능에서 GPT-4 및 Claude 3와 비견될 만한 결과를 Ko-Arena-Hard-Auto 벤치마크에서 기록하며 최고 수준의 역량을 입증했다. 또한 K.. 2025. 7. 14.
사카나 AI, LLM 협업 알고리즘 공개…복합 문제 해결 능력 향상 기대 AB-MCTS 기술, 여러 LLM이 상호작용하며 문제 해결 단일 모델 능가하는 성능 입증…오픈소스 'TreeQuest'로 배포 일본의 인공지능 스타트업 사카나 AI(Sakana AI)가 대규모 언어 모델(LLM)들이 복잡한 문제를 함께 해결할 수 있도록 돕는 새로운 알고리즘을 공개하며 인공지능 분야에 새로운 지평을 열었다. 이 기술은 '적응형 분기 몬테카를로 트리 탐색(Adaptive Branching Monte Carlo Tree Search, AB-MCTS)'으로 명명되었으며, 여러 AI 모델이 마치 인간 팀처럼 아이디어를 교환하고 개선하며 문제를 해결하는 방식이다.AB-MCTS는 깊이 우선 탐색과 너비 우선 탐색 전략을 결합하여, 각 작업에 가장 적합한 모델(예: ChatGPT 또는 Gemini)을.. 2025. 7. 8.
바이두, 차세대 AI 모델 ERNIE 4.5 오픈소스 공개 글로벌 AI 생태계 확장 위한 전략적 전환딥시크 등 경쟁 모델 능가하는 성능, 산업 전반에 파급 예상 중국의 거대 기술 기업 바이두가 자사의 최신 대규모 언어 모델(LLM)인 ERNIE 4.5의 오픈소스 버전을 전격 공개하며 글로벌 인공지능(AI) 생태계 확장을 위한 새로운 전략적 움직임을 보였습니다. https://github.com/PaddlePaddle/ERNIE GitHub - PaddlePaddle/ERNIE: The official repository for ERNIE 4.5 and ERNIEKit – its industrial-grade development toolkit basThe official repository for ERNIE 4.5 and ERNIEKit – its indust.. 2025. 7. 2.
반응형