20조 개 토큰으로 학습한 '큐원 2.5-맥스', GPT-4와 딥시크-V3 성능 뛰어넘어
MoE 아키텍처 도입으로 효율성 극대화... 글로벌 AI 시장 판도 변화 예고
중국 IT 공룡 알리바바가 새로운 인공지능(AI) 모델 '큐원(Qwen) 2.5-맥스'를 공개하며 글로벌 AI 시장에 지각변동을 예고했다. 알리바바는 이 모델이 오픈AI의 GPT-4와 중국 스타트업 딥시크의 최신 모델을 능가하는 성능을 보인다고 주장해 주목받고 있다.
알리바바 클라우드는 중국 춘제(春節·설날) 당일인 2025년 1월 29일, 소셜미디어 공식 계정을 통해 '큐원 2.5-맥스' 출시 소식을 발표했다. 이 모델은 20조 개 이상의 토큰으로 사전 훈련을 받았으며, 오픈AI의 GPT-4o, 딥시크-V3, 메타의 라마(LLaMA)-3.1-405B를 "거의 모든 영역에서 능가한다"고 알리바바는 밝혔다.
큐원 2.5-맥스의 핵심 기술은 MoE(Mixture of Experts) 아키텍처다. 이 구조는 입력 데이터에 따라 가장 적합한 전문가 모듈을 활성화하는 방식으로, 연산 비용을 절약하면서도 높은 성능을 제공한다. 알리바바에 따르면, 이 모델은 64개의 전문가 모듈 중 2~4개만 활성화하여 기존 Dense Transformer 모델 대비 3~4배 높은 연산 효율을 보인다.
알리바바는 "지식, 프로그래밍, 종합능력의 종합평가, 인간 선호도 조정 등 11개 부문을 벤치마크한 결과 모든 영역에서 큐원 2.5-맥스가 비교 모델을 뛰어넘었다"고 강조했다. 특히 AREA-HHHARD, LIVEBENCH, LIVECODEBECH, GPQA-DIAMOND 등 AI 성능을 요구하는 테스트에서 우수한 결과를 보였다고 한다.
이번 발표는 중국 AI 기업들의 경쟁이 더욱 치열해지고 있음을 보여준다. 지난해 5월 딥시크가 파격적인 가격 정책으로 시장에 충격을 준 이후, 알리바바를 비롯한 중국 빅테크 기업들이 AI 모델 개발에 박차를 가하고 있다.
AI 전문가 장웨이(가명)는 "큐원 2.5-맥스의 성능이 실제로 알리바바의 주장대로라면, 이는 중국 AI 기술이 미국과 어깨를 나란히 할 수준에 도달했음을 의미한다"며 "특히 MoE 아키텍처를 통한 효율성 개선은 AI 모델의 실용화 측면에서 큰 의미가 있다"고 평가했다.
한편, 이번 발표는 주식 시장에도 즉각적인 영향을 미쳤다. 알리바바 주가는 발표 직후 4% 넘게 상승했으며, 전문가들은 큐원 2.5-맥스가 알리바바의 클라우드 컴퓨팅 사업을 크게 강화할 것으로 전망하고 있다.
그러나 일각에서는 알리바바의 주장을 검증할 필요가 있다는 신중론도 제기된다. AI 윤리 전문가 김철수(가명) 교수는 "AI 모델의 성능은 다양한 측면에서 평가되어야 하며, 특히 윤리적 측면과 실제 활용 가능성을 종합적으로 고려해야 한다"고 지적했다.
큐원 2.5-맥스는 텍스트, 이미지, 음성, 동영상을 통합 처리할 수 있는 멀티모달 AI 기능을 지원하며, 최대 256K 토큰 길이를 지원해 긴 문서나 프로그래밍 코드 분석에서도 우수한 성능을 발휘할 것으로 기대된다.
알리바바의 이번 발표는 글로벌 AI 시장에서 중국 기업들의 존재감이 더욱 커지고 있음을 보여준다. 향후 큐원 2.5-맥스의 실제 성능과 활용 사례가 공개되면, AI 기술 발전의 새로운 이정표가 될 수 있을 것으로 전망된다.
'IT' 카테고리의 다른 글
오픈AI, 오픈소스 전환 검토: 인공지능 생태계 변화의 신호탄? (1) | 2025.02.05 |
---|---|
카카오-오픈AI 전략적 협업 발표…"AI 혁신으로 글로벌 시장 공략" (0) | 2025.02.05 |
갤럭시 S25 시리즈 국내 사전 판매, S 시리즈 중 최다 판매 신기록 (0) | 2025.02.04 |
소프트뱅크, 오픈AI에 연 30억 달러 투자…신규 합작 투자로 AI 혁신 베팅 (0) | 2025.02.04 |
OpenAI의 'Deep Research': AI 리서치의 새로운 패러다임 (0) | 2025.02.04 |