xAI, 플래그십 모델 경량화 'Grok 4 Fast' 공개... 비용 최대 98% 절감

인공지능(AI) 기업 xAI는 주력 모델인 Grok 4의 경량화 버전인 'Grok 4 Fast'를 출시했다고 2025년 9월 20일 밝혔다. 이 모델은 대부분의 작업에서 Grok 4와 동등한 성능을 발휘하면서도 컴퓨팅 자원을 약 40% 덜 사용하며, 작업당 비용을 최대 98%까지 절감할 수 있다는 것이 회사 측의 설명이다. Grok 4 Fast는 기존의 단순 응답 및 추론 중심 작업을 단일 아키텍처로 통합한 것이 특징이다.

xAI의 이번 Grok 4 Fast 출시는 플래그십 모델의 성능을 유지하면서도 운영 효율성을 극대화하는 데 중점을 두었다. 회사는 이 모델이 비슷한 결과를 도출하기 위해 평균적으로 **'사고 토큰(thinking tokens)'**을 40% 적게 사용한다고 강조했다. 이는 복잡한 문제를 해결할 때 다른 모델들이 더 많은 중간 단계를 거치며 계산량을 요구하는 것과 대비되는 부분이다. Grok 4 Fast의 등장은 단순 응답 모델과 추론 중심 모델을 분리했던 기존 버전들의 방식을 벗어나, 단일 아키텍처로 두 가지 접근 방식을 결합하는 하이브리드 모델(hybrid models) 트렌드에 부합한다.

Grok 4 Fast는 주요 벤치마크에서 선두 모델들과 근접한 성과를 보였다. 구체적으로 GPQA Diamond 벤치마크에서는 85.7%, AIME 2025 벤치마크에서는 92.0%를 기록하며, Grok 4 및 GPT-5와 같은 최고 수준의 모델들과 유사한 점수를 달성했다.

특히 이 시스템은 웹 브라우징(web browsing)이나 코드 실행(code execution) 등 외부 도구(external tools)를 자체적으로 사용하도록 훈련되었다는 점이 주목할 만하다. BrowseComp 벤치마크에서는 44.9%, X Bench Deepsearch 벤치마크에서는 74%를 기록하며 기존 Grok 4를 능가하는 성능을 보였다. LMArena-Search 벤치마크에서는 이전에 선두를 차지했던 OpenAI의 o3-websearch마저 제쳤다. 현재 Text Arena 순위에서는 유사 규모 모델 중 상위인 8위에 올라 있다.

Grok 4 Fast는 이전 버전들이 단순 답변과 추론 작업에 서로 다른 모델을 의존했던 것과 달리, 단일 아키텍처 내에서 시스템 프롬프트(system prompt)를 통해 동작을 제어하도록 설계되었다. 이는 효율성을 높이는 주요 기술적 변화로 분석된다.

Grok 4 Fast는 추론 중심 작업에 최적화된 버전과 빠른 답변에 최적화된 버전 두 가지로 제공된다. 두 버전 모두 200만 토큰의 컨텍스트 창(context window)을 지원한다. 사용자는 grok.com 웹사이트, iOS 및 Android 앱, xAI API를 통해 Grok 4 Fast를 이용할 수 있다. 가격은 토큰 유형에 따라 백만 토큰당 $0.05에서 $1.00 사이로 책정되었으며, 현재는 OpenRouter 및 Vercel을 통해 무료로 접근이 가능하다.

참고 출처 : "xAI releases cheaper, fast language model Grok 4 Fast"

저작자표시 비영리 (새창열림)

'IT' 카테고리의 다른 글

알리바바, 자체 최대 규모 AI 모델 'Qwen3-Max' 공개 (0)	2025.09.25
알리바바, 멀티모달 AI 'Qwen3-Omni' 오픈소스 공개 (0)	2025.09.23
구글 제미니, 혁신 AI 이미지 모델 '나노 바나나' 앞세워 앱스토어 1위 석권 (1)	2025.09.17
유튜브, 쇼츠 제작용 생성형 AI 도구 발표…콘텐츠 생산성 제고 (0)	2025.09.17
영국-미국, 수십억 달러 규모 기술 협력 협정 체결로 글로벌 AI 패권 강화 (1)	2025.09.14

달달한 하루

xAI, 플래그십 모델 경량화 'Grok 4 Fast' 공개... 비용 최대 98% 절감

'IT' 카테고리의 다른 글

티스토리툴바

xAI, 플래그십 모델 경량화 'Grok 4 Fast' 공개... 비용 최대 98% 절감

'IT' 카테고리의 다른 글

관련글

티스토리툴바