본문 바로가기
반응형

IT481

알리바바, 멀티모달 AI 'Qwen3-Omni' 오픈소스 공개 텍스트·음성·이미지·영상 통합 처리…오픈소스 AI 생태계에 새바람실시간 음성 상호작용 가능…다국어 지원으로 활용성 극대화 알리바바 클라우드의 AI 연구팀인 콴원(Qwen)이 텍스트, 이미지, 오디오, 비디오를 모두 이해하고 실시간 음성으로 응답하는 옴니모달(omni-modal) 대규모 언어모델(LLM) 'Qwen3-Omni'를 오픈소스로 공개했다. 이는 폐쇄형 모델이 주도하던 멀티모달 AI 시장에서 오픈소스 모델의 새로운 가능성을 제시했다는 평가를 받고 있다.텍스트 넘어 멀티모달로…경계 허무는 AI최근 인공지능 분야는 단순히 텍스트를 처리하는 것을 넘어, 음성, 이미지, 영상을 복합적으로 이해하고 상호작용하는 멀티모달 기술 경쟁이 치열하다. 'Qwen3-Omni'는 이러한 흐름 속에서 텍스트와 비전, 오.. 2025. 9. 23.
xAI, 플래그십 모델 경량화 'Grok 4 Fast' 공개... 비용 최대 98% 절감 인공지능(AI) 기업 xAI는 주력 모델인 Grok 4의 경량화 버전인 'Grok 4 Fast'를 출시했다고 2025년 9월 20일 밝혔다. 이 모델은 대부분의 작업에서 Grok 4와 동등한 성능을 발휘하면서도 컴퓨팅 자원을 약 40% 덜 사용하며, 작업당 비용을 최대 98%까지 절감할 수 있다는 것이 회사 측의 설명이다. Grok 4 Fast는 기존의 단순 응답 및 추론 중심 작업을 단일 아키텍처로 통합한 것이 특징이다. xAI의 이번 Grok 4 Fast 출시는 플래그십 모델의 성능을 유지하면서도 운영 효율성을 극대화하는 데 중점을 두었다. 회사는 이 모델이 비슷한 결과를 도출하기 위해 평균적으로 **'사고 토큰(thinking tokens)'**을 40% 적게 사용한다고 강조했다. 이는 복잡한 .. 2025. 9. 21.
구글 제미니, 혁신 AI 이미지 모델 '나노 바나나' 앞세워 앱스토어 1위 석권 출시 후 사용자 2,300만 명 증가, 다운로드 및 소비자 지출 급증미국 앱스토어 ChatGPT 제치고 정상 등극, 108개국 탑 5 진입 구글의 인공지능 앱 제미니(Gemini)가 지난 8월 새로운 AI 이미지 편집 모델 '나노 바나나(Nano Banana)'를 출시한 이후 모바일 앱 채택이 급증하며 글로벌 앱스토어 차트에서 정상을 차지했습니다. 앱 인텔리전스 기업 앱피겨스(Appfigures)의 데이터에 따르면, 제미니 앱은 9월 현재까지 전월 대비 45%의 다운로드 증가율을 기록하며 빠르게 성장하고 있습니다. 제미니는 '나노 바나나' 모델 출시 직후인 9월 8일 미국 앱스토어에서 2위를 기록했으며, 이후 9월 12일에는 오픈AI의 챗GPT(ChatGPT)를 제치고 1위에 올라 현재까지 그 자리를 유.. 2025. 9. 17.
유튜브, 쇼츠 제작용 생성형 AI 도구 발표…콘텐츠 생산성 제고 텍스트-투-비디오 등 주요 기능 도입…숏폼 시장 경쟁 심화콘텐츠 제작 진입 장벽 낮춰…저작권 등 윤리적 과제도 제기 유튜브는 지난 화요일(현지 시각) 'Made on YouTube' 라이브 행사에서 Shorts 크리에이터를 위한 새로운 생성형 AI 도구들을 공개하며 콘텐츠 제작 방식에 혁신을 예고했습니다. 구글의 텍스트-투-비디오 생성형 AI 모델인 Veo 3의 맞춤형 버전과 새로운 리믹스 도구, 그리고 "Edit with AI" 기능이 주요 내용입니다. Veo 3 Fast: 빠르고 생생한 비디오 클립 생성 유튜브는 구글의 Veo 3 모델을 Shorts에 맞게 커스터마이징한 "Veo 3 Fast"를 선보였습니다. 이 맞춤형 버전은 480p 해상도로 낮은 지연 시간(latency)을 제공하여 비디오 클립.. 2025. 9. 17.
영국-미국, 수십억 달러 규모 기술 협력 협정 체결로 글로벌 AI 패권 강화 트럼프 대통령 국빈방문과 함께 AI·반도체·양자컴퓨팅 분야 포괄적 협력 본격화 도널드 트럼프 미국 대통령의 영국 국빈 방문을 앞두고 양국이 수십억 달러 규모의 획기적인 기술 협력 협정 체결을 확정했다고 영국 주재 미국 대사관이 14일 공식 발표했다. 협정 최종안에 따르면, 양국은 인공지능 공동 연구개발, 반도체 공급망 안전성 강화, 차세대 통신 인프라 구축, 양자컴퓨팅 상용화 등 4개 분야에서 포괄적 협력을 추진한다. 영국 기술부 리즈 켄달 장관은 "AI와 양자컴퓨팅 같은 첨단 기술이 우리 삶을 근본적으로 변화시킬 것"이라며 "이번 협정을 통해 양국이 글로벌 기술 혁신을 선도할 수 있을 것"이라고 강조했다.협정의 주요 내용은 다음과 같다:1. AI 분야 협력공동 AI 안전성 연구소 설립AI 윤리 및 거.. 2025. 9. 14.
Anthropic, AI 모델 '클로드'에 파일 생성 및 편집 기능 추가 텍스트 명령만으로 문서, 스프레드시트, 프레젠테이션 제작 가능 데이터 분석 및 보고서 작성 등 전문 작업 지원…'협업자'로 진화 인공지능(AI) 스타트업 Anthropic이 자사의 대형언어모델(LLM) '클로드(Claude)'에 파일 생성 및 편집 기능을 추가했다고 발표했다. 이번 업데이트를 통해 클로드는 사용자가 텍스트로 내린 지시를 기반으로 엑셀, 워드, 파워포인트, PDF 파일을 직접 만들거나 수정할 수 있게 되었다. 기존의 챗봇들은 주로 텍스트 기반의 답변을 제공하는 데 그쳤지만, 클로드의 새로운 기능은 이러한 한계를 넘어선다. 사용자는 이제 복잡한 데이터 분석, 재무 모델링, 보고서 작성과 같은 전문적인 작업을 클로드에게 맡길 수 있다. 예를 들어, 재무 데이터를 업로드하고 '이 데이터를 기반으.. 2025. 9. 11.
반응형