반응형 전체 글532 마이크로소프트, 최대 90분 길이 팟캐스트 제작 가능한 AI 모델 '바이브보이스' 공개 다중 화자 대화·감정 표현 구사... "자발적 노래 생성 능력까지 잠재"초저프레임 오디오 토크나이저 혁신, 긴 오디오 시퀀스 처리 효율 극대화 인공지능(AI) 기술팀 = 마이크로소프트(MS)가 팟캐스트와 같은 긴 형식의 다중 화자 대화 오디오를 텍스트로 생성하는 새로운 AI 모델 '바이브보이스(VibeVoice)'를 공개했다. 이 모델은 최대 90분 길이의 연속적인 음성 합성이 가능하며, 자연스러운 감정 표현과 화자 일관성 유지 능력을 통해 기존 텍스트-음성 변환(TTS) 기술의 한계를 뛰어넘었다는 평가를 받는다. 최근 팟캐스트, 오디오북 등 장문 오디오 콘텐츠 시장이 급성장하고 있으나, 기존의 TTS 모델은 대부분 짧은 문장이나 단일 화자 음성 생성에 초점을 맞추어 왔다. 여러 화자가 등장하는 긴 대화.. 2025. 9. 28. 애플, 이미지 이해·생성 통합 멀티모달 AI 모델 '만사노' 공개 하이브리드 토크나이저 채택... 기존 모델의 '이해·생성 성능 상충' 문제 완화300M에서 30B까지 확장 가능... 벤치마크서 통합 모델 중 최고 수준 기록 애플 연구팀이 이미지 이해와 생성을 하나의 모델에서 모두 수행하는 통합 멀티모달 대규모 언어 모델(LLM)인 '만사노(Manzano)'를 공개했다. 이 모델은 기존 통합 모델들이 양쪽 기능 중 하나에서 성능 저하를 겪는 문제를 해소하기 위해 '하이브리드 비전 토크나이저'라는 새로운 구조를 도입한 것이 특징이다.최근 인공지능(AI) 분야에서는 텍스트뿐만 아니라 이미지, 음성 등 다양한 형태의 데이터를 처리하고 생성하는 멀티모달(Multimodal) AI 모델 개발이 활발하다. 그러나 이미지를 텍스트로 이해하는(Understanding) 과정과, 텍.. 2025. 9. 28. 메타, AI 생성 동영상 피드 '바이브스' 출시...광고에 구글 제미나이 활용도 검토 숏폼 영상 생태계 AI 중심으로 재편 시도...경쟁사 기술 협력 가능성 주목광고 타겟팅 효율 강화 목표...거대 기술 기업 간 이례적 협력 가능성 시사 소셜 미디어 기업 메타(Meta)가 인공지능(AI)이 생성한 숏폼 동영상 전용 피드 '바이브스(Vibes)'를 공식 출시하고 AI 중심의 콘텐츠 생태계 구축에 속도를 내고 있다. 이와 더불어 메타는 주력 사업인 광고 비즈니스의 효율성을 높이기 위해 경쟁사인 구글 클라우드의 '제미나이(Gemini)' AI 모델을 활용하는 방안을 초기 단계에서 검토 중인 것으로 알려져 업계의 주목을 받고 있다.마크 저커버그 메타 CEO는 지난 25일(현지시간) 인스타그램을 통해 AI 기반의 새로운 피드 출시를 직접 알렸으며, 이는 AI 기반 창작 도구를 사용자들에게 제공하고.. 2025. 9. 27. 삼성전자, AI 업무 생산성 측정 지표 ‘트루벤치’ 개발 정확성·속도·비용 등 종합 평가…AI 모델 도입 기준 제시'할루시네이션' 문제 해결 목표, LLM 도입 속도 높일 듯 삼성전자가 업무용 AI(인공지능) 모델의 생산성을 객관적으로 측정하고 평가하는 새로운 지표인 '트루벤치(TrueBench)'를 개발했다고 25일 밝혔다. 이는 실제 업무 환경에서 대규모언어모델(LLM)의 효용성을 정확하게 판단하고 도입 기준을 제시하기 위한 목적으로 개발되었다.최근 기업들은 업무 효율을 높이기 위해 LLM 기반의 생성형 AI 기술 도입을 적극적으로 검토하고 있으나, AI 모델의 성능을 실제 업무 생산성 향상으로 객관적으로 연결할 수 있는 기준이 부족하다는 지적이 꾸준히 제기되어 왔다. 특히 AI가 그럴듯한 거짓 정보를 생성하는 '할루시네이션(환각)' 문제 등으로 인해 도입.. 2025. 9. 26. 영국 AI 스타트업 Nscale, 11억 달러 투자 유치...유럽 역대 최대 시리즈 B 노르웨이 Aker 주도로 엔비디아·노키아·델 등 글로벌 기업 참여북극권 재생에너지 AI 팩토리 구축...OpenAI Stargate와 연계 프로젝트 영국 AI 인프라 전문기업 Nscale이 25일 시리즈 B 라운드에서 11억 달러의 투자를 유치했다고 발표했다. 이는 유럽 스타트업 역사상 최대 규모의 시리즈 B 투자로 기록됐다.이번 투자는 노르웨이 산업투자회사 Aker가 주도했으며, 엔비디아, 노키아, 델 등 글로벌 기술기업들이 참여했다. Aker는 2억 8500만 달러를 투자해 9.3%의 지분을 확보했다.Nscale은 2022년 설립된 'neocloud' 기업으로 AI 모델 훈련과 추론을 위한 전문 인프라를 제공한다. 기존 클라우드 서비스와 달리 AI 워크로드에 특화된 서비스를 통해 고성능 컴퓨팅 환경을.. 2025. 9. 25. 중국 해커 그룹, 미국 기업 1년 이상 잠복...BRICKSTORM 백도어로 기술 탈취 소프트웨어·로펌 대상 정교한 공격...미중 무역분쟁 정보 수집 목적FBI 수사 착수...클라우드 시스템 침투해 독점기술 탈취 중국 해커 그룹이 1년 이상 미국 소프트웨어 개발업체와 로펌을 대상으로 정교한 사이버 공격을 진행해 왔다고 구글 산하 Mandiant와 CNN이 24일 발표했다.이 해커 그룹은 BRICKSTORM 백도어를 사용해 미국 기업들의 클라우드 컴퓨팅 시스템에 침투, 독점 소프트웨어를 탈취하고 새로운 취약점 발견에 활용하고 있는 것으로 조사됐다.구글 위협 인텔리전스 그룹(GTIG)과 Mandiant가 공동 발표한 보고서에 따르면, 이 위협 그룹은 클라우드 컴퓨팅 회사들을 공격해 수많은 미국 기업들이 주요 데이터를 저장하는 시스템에 침투했다.공격자들은 일부 경우 1년 이상 미국 기업 네트워크.. 2025. 9. 25. 이전 1 2 3 4 5 6 ··· 89 다음 반응형