Stability AI, Stable Audio Open Small 모델 공개
모바일 AI 오디오 생성 시대의 개막과 한계
AI 스타트업 Stability AI가 스마트폰에서 직접 구동 가능한 오디오 생성 모델 Stable Audio Open Small을 공개했다. 이 모델은 ARM 기반 모바일 기기에서 8초 이내에 11초 분량의 오디오 샘플을 생성할 수 있어, 오디오 생성 AI의 대중화에 한 걸음 다가섰다는 평가를 받고 있다.
최근 Stability AI는 ARM과의 협업을 통해 3억4,100만 파라미터 규모의 오디오 생성 AI 모델 Stable Audio Open Small을 발표했다. 이 모델은 스마트폰 등 모바일 기기에서 오프라인으로 오디오 샘플과 효과음을 빠르게 생성할 수 있다는 점이 특징이다.
구분 | Stable Audio Open Small | 경쟁 모델(Suno, Udio) |
구동 환경 | 스마트폰(오프라인) | 클라우드(온라인) |
생성 시간 | 8초 이내 | 수십 초~수 분 |
지원 언어 | 영어 | 다국어(일부) |
저작권 이슈 | 없음(로열티 프리) | 있음(저작권 논란) |
라이선스 | 무료(연매출 100만불 이하) | 유료/제한적 |
Stability AI는 "이번 모델의 학습 데이터는 Free Music Archive와 Freesound 등 로열티 프리 음원만을 사용했다"고 밝혀, 기존 AI 오디오 생성 모델의 저작권 논란을 피했다. 다만, "Stable Audio Open Small은 영어 프롬프트만 지원하며, 현실적인 보컬이나 고음질 곡 생성에는 한계가 있다"고 Stability AI 측은 설명했다.
시장조사업체 Statista에 따르면, 2025년 글로벌 AI 오디오 시장 규모는 30억 달러를 돌파할 전망이다. 이에 대해 업계 전문가는 "모바일 기기에서 직접 AI 오디오를 생성할 수 있다는 점은 크리에이터와 개발자 모두에게 새로운 기회를 제공할 것"이라고 평가했다.
한편, 연매출 100만 달러 이상 기업은 Stability AI의 엔터프라이즈 라이선스를 별도로 구매해야 하며, 이는 AI 기술의 상업적 활용에 일정한 제약이 될 수 있다.
참고링크
'IT' 카테고리의 다른 글
구글, Gemini AI로 스마트워치·자동차·TV·XR까지 확장…AI 일상화 가속 (1) | 2025.05.15 |
---|---|
OpenAI, GPT-4.1 모델 ChatGPT에 공식 도입…AI 대중화 가속 (0) | 2025.05.15 |
ChatGPT, 이제 SharePoint 연동으로 기업 데이터 분석 가능해져 (0) | 2025.05.13 |
단 3초만에 목소리 복제하는 'AI Voice Cloning', 자연스러운 음성 생성 혁신 이끈다 (0) | 2025.05.11 |
구글, 크롬 브라우저에 AI 기반 사기 감지 기능 도입 (1) | 2025.05.11 |