본문 바로가기

ai효율성3

삼성, 700만 매개변수 '초소형 AI' TRM 개발…거대 모델 능가하는 추론 능력 GPT-4o Mini, Gemini 2.5 Pro 등 압도…ARC-AGI 벤치마크서 45% 달성 삼성전자 종합기술원 AI 랩(SAIL Montreal) 연구팀이 단 700만 개의 매개변수(파라미터)만을 가진 초소형 AI 모델 'TRM(Tiny Recursive Model)'을 개발하고, 복잡한 추론 능력 벤치마크인 ARC-AGI 테스트에서 대규모 언어 모델(LLM)들을 능가하는 성능을 보이며 AI 아키텍처 혁신을 입증했다. TRM은 삼성 SAIT 소속 Alexia Jolicoeur-Martineau 연구원이 발표한 논문 "Less is More: Recursive Reasoning with Tiny Networks"를 통해 공개되었다. 이 모델은 GPT-4o mini, Gemini 2.5 Pro와 같은 .. 2025. 10. 11.

xAI, 플래그십 모델 경량화 'Grok 4 Fast' 공개... 비용 최대 98% 절감 인공지능(AI) 기업 xAI는 주력 모델인 Grok 4의 경량화 버전인 'Grok 4 Fast'를 출시했다고 2025년 9월 20일 밝혔다. 이 모델은 대부분의 작업에서 Grok 4와 동등한 성능을 발휘하면서도 컴퓨팅 자원을 약 40% 덜 사용하며, 작업당 비용을 최대 98%까지 절감할 수 있다는 것이 회사 측의 설명이다. Grok 4 Fast는 기존의 단순 응답 및 추론 중심 작업을 단일 아키텍처로 통합한 것이 특징이다. xAI의 이번 Grok 4 Fast 출시는 플래그십 모델의 성능을 유지하면서도 운영 효율성을 극대화하는 데 중점을 두었다. 회사는 이 모델이 비슷한 결과를 도출하기 위해 평균적으로 **'사고 토큰(thinking tokens)'**을 40% 적게 사용한다고 강조했다. 이는 복잡한 .. 2025. 9. 21.

알리바바, GPT-4 능가하는 AI 모델 '큐원 2.5-맥스' 공개... 중국 AI 굴기 가속화 20조 개 토큰으로 학습한 '큐원 2.5-맥스', GPT-4와 딥시크-V3 성능 뛰어넘어MoE 아키텍처 도입으로 효율성 극대화... 글로벌 AI 시장 판도 변화 예고 중국 IT 공룡 알리바바가 새로운 인공지능(AI) 모델 '큐원(Qwen) 2.5-맥스'를 공개하며 글로벌 AI 시장에 지각변동을 예고했다. 알리바바는 이 모델이 오픈AI의 GPT-4와 중국 스타트업 딥시크의 최신 모델을 능가하는 성능을 보인다고 주장해 주목받고 있다. 알리바바 클라우드는 중국 춘제(春節·설날) 당일인 2025년 1월 29일, 소셜미디어 공식 계정을 통해 '큐원 2.5-맥스' 출시 소식을 발표했다. 이 모델은 20조 개 이상의 토큰으로 사전 훈련을 받았으며, 오픈AI의 GPT-4o, 딥시크-V3, 메타의 라마(LLaMA)-3... 2025. 2. 5.

이전 1 다음

티스토리툴바