본문 바로가기
반응형

AI혁신19

"3초면 충분하다" 알리바바, 목소리 복제·디자인 AI 'Qwen3' 전격 공개 경쟁 모델 대비 압도적 오류율 감소… 10개 국어 완벽 지원텍스트 묘사만으로 감정 섞인 가상 음성 제작 가능해져 알리바바 클라우드의 Qwen 팀은 2025년 12월 23일(현지시간), 단 3초의 오디오로 목소리를 복제하거나 텍스트 설명만으로 가상 음성을 만드는 새로운 AI 모델 2종을 출시했다. 이 모델들은 기존 오픈AI나 일레븐랩스의 솔루션을 능가하는 성능을 갖추고 알리바바 클라우드 API를 통해 전 세계 개발자들에게 제공된다. 음성 복제의 한계를 넘다: Qwen3-TTS-VC-Flash과거에는 특정인의 목소리를 자연스럽게 복제하기 위해 수 분에서 수 시간 분량의 고품질 녹음 데이터가 필요했다. 하지만 이번에 공개된 ‘Qwen3-TTS-VC-Flash’는 단 3초의 샘플만으로도 대상의 음색, 억.. 2025. 12. 24.
OpenAI GPT-5 출시 임박…AI 업계 게임체인저 등장 8월 초 출시 예정…라우터 시스템·범용 검증기로 기술적 혁신클로드 4 압도하는 코딩 성능…100만 토큰 컨텍스트 윈도우 OpenAI가 차세대 AI 모델인 GPT-5의 출시를 앞두고 있다. 6일 업계에 따르면 GPT-5는 2025년 8월 초 출시될 예정으로, 기존 GPT-4o를 뛰어넘는 혁신적인 성능으로 AI 업계의 새로운 게임체인저로 주목받고 있다. 샘 알트먼 OpenAI CEO는 최근 팟캐스트에서 "내가 이해하지 못한 질문을 모델에 넣었더니 완벽한 답변이 돌아왔다"며 "바로 이거다 싶었다"고 GPT-5의 뛰어난 성능을 언급했다. GPT-5의 가장 혁신적인 특징은 '라우터 시스템'이다. 이는 사용자의 요청 유형에 따라 자동으로 최적의 연산 경로를 선택하는 기술로, 추론 모드, 비추론 모드, 도구 사용 모.. 2025. 8. 7.
Netflix, 생성형 AI를 실제 콘텐츠 제작에 활용... 'The Eternaut'에서 건물 붕괴 장면 AI로 제작 스트리밍 서비스 최초로 생성형 AI를 실제 콘텐츠에 적용기존 VFX 대비 10배 빠른 제작 속도 달성 Netflix가 생성형 AI를 실제 콘텐츠 제작에 활용했다고 발표했다. 아르헨티나 SF 시리즈 'The Eternaut'에서 건물 붕괴 장면을 생성형 AI로 제작했으며, 이는 스트리밍 서비스 최초로 AI를 실제 콘텐츠에 적용한 사례다. Netflix 공동 CEO 테드 사란도스는 2분기 실적 발표 회의에서 "The Eternaut의 제작진이 부에노스아이레스의 건물 붕괴 장면을 원했다"며 "AI 기반 도구를 사용해 놀라운 결과를 놀라운 속도로 달성했다"고 설명했다. 해당 VFX 시퀀스는 기존 전통적인 VFX 도구와 워크플로우보다 10배 빠르게 완성되었으며, 해당 예산으로는 실현 불가능했을 정도로 비용이 절감.. 2025. 7. 20.
업스테이지, 310억 매개변수 '솔라 프로 2' 출시 혁신적인 추론 및 다국어 능력으로 기업 시장 정조준한국어 처리 성능 세계 최고 수준…금융, 헬스케어, 법률 분야 특화 인공지능(AI) 스타트업 업스테이지가 310억 개의 매개변수를 가진 대규모 언어 모델(LLM) '솔라 프로 2(Solar Pro 2)'를 공식 출시하며 글로벌 AI 시장에 새로운 이정표를 세웠다. 솔라 프로 2는 고도의 추론 능력, 유연한 도구 활용성, 그리고 뛰어난 다국어 처리 능력을 바탕으로 금융, 헬스케어, 법률 등 다양한 핵심 산업 분야에서 최전선의 성능을 제공하도록 설계되었다. 업스테이지에 따르면, 솔라 프로 2는 한국어 처리 성능에서 GPT-4 및 Claude 3와 비견될 만한 결과를 Ko-Arena-Hard-Auto 벤치마크에서 기록하며 최고 수준의 역량을 입증했다. 또한 K.. 2025. 7. 14.
구글, 크롬북 플러스에 AI 기능 대거 추가…생산성 및 창의성 강화 제미나이 통합부터 매직 지우개까지…AI로 사용자 경험 혁신AI 노트북 시장 경쟁 심화 예고 구글이 크롬북 플러스(Chromebook Plus) 기기에 인공지능(AI) 기능을 대거 추가하며, 사용자들에게 더욱 강력한 생산성과 창의적인 경험을 제공할 것이라고 보도했다. 크롬북 플러스, 제미나이 통합으로 스마트함 더한다이번 업데이트의 핵심은 구글의 대규모 언어 모델(LLM)인 제미나이(Gemini)가 크롬북 플러스에 통합된다는 점이다. 사용자들은 이제 크롬북에서 제미나이를 직접 활용하여 텍스트 생성, 정보 요약, 아이디어 구상 등 다양한 작업을 보다 효율적으로 수행할 수 있게 된다. 또한, 구글 포토(Google Photos)의 인기 AI 기반 사진 편집 도구인 '매직 지우개(Magic Eraser)' 기능.. 2025. 6. 24.
Perplexity, 'Labs' 기능 공개하며 챗GPT와 유사한 대화형 AI로 전환 시도 간결하고 출처가 명확한 답변으로 주목받아온 AI 검색 엔진 퍼플렉시티(Perplexity)가 새로운 'Labs' 기능을 공개하며 챗GPT(ChatGPT)와 유사한 대화형 인공지능(AI) 서비스로의 전략적 전환을 시사하고 있습니다. 'Labs' 기능: 퍼플렉시티의 새로운 실험 공간퍼플렉시티의 'Labs'는 개발 중인 최첨단 AI 기능과 모델을 사용자들이 직접 테스트하고 상호작용할 수 있도록 설계된 실험적인 공간입니다. 이곳은 퍼플렉시티가 사용자 피드백을 신속하게 수집하고, 이를 바탕으로 미래 제품을 빠르게 개선해 나갈 수 있는 공개 베타 환경의 역할을 합니다. 이러한 접근 방식은 퍼플렉시티가 기존의 '답변 엔진'이라는 정체성을 넘어, 보다 유연하고 대화 지향적인 AI 서비스로 진화하려는 의지를 명확히 보.. 2025. 5. 30.
반응형