반응형 ai효율성2 xAI, 플래그십 모델 경량화 'Grok 4 Fast' 공개... 비용 최대 98% 절감 인공지능(AI) 기업 xAI는 주력 모델인 Grok 4의 경량화 버전인 'Grok 4 Fast'를 출시했다고 2025년 9월 20일 밝혔다. 이 모델은 대부분의 작업에서 Grok 4와 동등한 성능을 발휘하면서도 컴퓨팅 자원을 약 40% 덜 사용하며, 작업당 비용을 최대 98%까지 절감할 수 있다는 것이 회사 측의 설명이다. Grok 4 Fast는 기존의 단순 응답 및 추론 중심 작업을 단일 아키텍처로 통합한 것이 특징이다. xAI의 이번 Grok 4 Fast 출시는 플래그십 모델의 성능을 유지하면서도 운영 효율성을 극대화하는 데 중점을 두었다. 회사는 이 모델이 비슷한 결과를 도출하기 위해 평균적으로 **'사고 토큰(thinking tokens)'**을 40% 적게 사용한다고 강조했다. 이는 복잡한 .. 2025. 9. 21. 알리바바, GPT-4 능가하는 AI 모델 '큐원 2.5-맥스' 공개... 중국 AI 굴기 가속화 20조 개 토큰으로 학습한 '큐원 2.5-맥스', GPT-4와 딥시크-V3 성능 뛰어넘어MoE 아키텍처 도입으로 효율성 극대화... 글로벌 AI 시장 판도 변화 예고 중국 IT 공룡 알리바바가 새로운 인공지능(AI) 모델 '큐원(Qwen) 2.5-맥스'를 공개하며 글로벌 AI 시장에 지각변동을 예고했다. 알리바바는 이 모델이 오픈AI의 GPT-4와 중국 스타트업 딥시크의 최신 모델을 능가하는 성능을 보인다고 주장해 주목받고 있다. 알리바바 클라우드는 중국 춘제(春節·설날) 당일인 2025년 1월 29일, 소셜미디어 공식 계정을 통해 '큐원 2.5-맥스' 출시 소식을 발표했다. 이 모델은 20조 개 이상의 토큰으로 사전 훈련을 받았으며, 오픈AI의 GPT-4o, 딥시크-V3, 메타의 라마(LLaMA)-3... 2025. 2. 5. 이전 1 다음 반응형