반응형 알리바바클라우드2 "3초면 충분하다" 알리바바, 목소리 복제·디자인 AI 'Qwen3' 전격 공개 경쟁 모델 대비 압도적 오류율 감소… 10개 국어 완벽 지원텍스트 묘사만으로 감정 섞인 가상 음성 제작 가능해져 알리바바 클라우드의 Qwen 팀은 2025년 12월 23일(현지시간), 단 3초의 오디오로 목소리를 복제하거나 텍스트 설명만으로 가상 음성을 만드는 새로운 AI 모델 2종을 출시했다. 이 모델들은 기존 오픈AI나 일레븐랩스의 솔루션을 능가하는 성능을 갖추고 알리바바 클라우드 API를 통해 전 세계 개발자들에게 제공된다. 음성 복제의 한계를 넘다: Qwen3-TTS-VC-Flash과거에는 특정인의 목소리를 자연스럽게 복제하기 위해 수 분에서 수 시간 분량의 고품질 녹음 데이터가 필요했다. 하지만 이번에 공개된 ‘Qwen3-TTS-VC-Flash’는 단 3초의 샘플만으로도 대상의 음색, 억.. 2025. 12. 24. 알리바바, 자체 최대 규모 AI 모델 'Qwen3-Max' 공개 1천만 토큰 컨텍스트 지원, 다중 모드 기능 강화로 경쟁력 확보빅테크 AI 경쟁 심화... 한국 시장 진출 가능성에 관심 집중중국 IT 공룡 알리바바 그룹이 자체 개발한 초거대 언어 모델 '퉁이쳰원(通義千問)' 시리즈의 최신작 'Qwen3-Max'를 전격 출시했다. 이번 모델은 알리바바가 공개한 AI 모델 중 역대 최대 규모와 최고 성능을 자랑하며, 인공지능(AI) 시장의 경쟁 구도에 새로운 변수가 될 전망이다. Qwen3-Max는 특히 1천만 토큰에 달하는 방대한 컨텍스트(문맥) 처리 능력을 갖춘 것이 특징이다. 이는 기존 모델들이 수십만에서 100만 토큰 수준의 컨텍스트를 지원했던 것에 비해 압도적인 성능이다. 이를 통해 사용자는 장문의 문서, 코드, 영상, 오디오 파일 등을 한 번에 처리하고 분석할.. 2025. 9. 25. 이전 1 다음 반응형