본문 바로가기
반응형

전체 글627

Holo3, 실무 자동화 '성공률 78.8%' 달성… "컴퓨터 직접 쓰는 AI 시대" OSWorld 벤치마크서 압도적 성능 입증... 35B·122B 모델 오픈 소스로 공개 단순한 텍스트 답변을 넘어 인간처럼 컴퓨터를 조작하는 AI 모델 'Holo3'가 실무 자동화의 새로운 지평을 열었다. 4일 업계에 따르면, Holo3는 최신 AI 실행력 측정 지표인 OSWorld-Verified 벤치마크에서 78.85%라는 높은 성공률을 기록하며 단순 보조 도구를 넘어선 '실행형 AI'로서의 가능성을 증명했다.Holo3의 핵심은 사람의 감독 하에 화면을 시각적으로 인식하고, 직접 클릭과 타이핑을 수행하며 다단계 작업을 완수하는 능력이다. 기존 LLM(거대언어모델)이 API 연동에 의존했던 것과 달리, Holo3는 일반적인 운영체제 환경에서 인간과 동일한 방식으로 소프트웨어를 제어한다. 개발 측은 연구.. 2026. 4. 4.
알리바바, 옴니모달 'Qwen3.5-Omni' 기습 공개… 구글·오픈AI에 도전장 영상·음성만으로 코딩 척척... 제미나이 3.1 Pro와 대등한 성능 확보 중국 알리바바가 텍스트, 이미지, 오디오, 비디오를 동시에 처리하는 강력한 옴니모달(Omni-modal) AI 모델 'Qwen3.5-Omni'를 공개하며 글로벌 선두권과의 격차를 좁혔다. 특히 별도의 코딩 학습 없이 시각 정보와 음성 지시만으로 복잡한 프로그램을 설계하는 능력을 선보여 업계를 놀라게 했다.Qwen3.5-Omni는 구글의 '제미나이 3.1 Pro'와 대등하거나 일부 지표에서는 이를 상회하는 성능을 보여주는 것으로 나타났다. 가장 큰 특징은 실시간 스트리밍 대화 능력이다. 사용자가 카메라로 주변 환경을 보여주며 실시간으로 질문하면, AI가 즉각적인 오디오 피드백과 함께 관련 정보를 인터넷에서 검색해 답변한다. 이는 구.. 2026. 4. 4.
Mistral, 오픈소스 음성 생성 모델 공개 텍스트-to-스피치 분야에서 고품질 오픈 모델로 경쟁 가속… “개발자 중심 AI” 선언 프랑스 AI 스타트업 Mistral AI가 2026년 3월 26일(현지시간) 새로운 오픈소스 음성 생성 모델 ‘Mistral Speech’를 공식 출시했다. 이 모델은 기존 상용 TTS(Text-to-Speech) 모델(Google TTS, ElevenLabs, OpenAI TTS 등) 대비 음성 품질과 자연스러움에서 동등하거나 뛰어나면서도 완전 오픈소스로 공개되어 개발자·기업들의 즉각적인 커스터마이징이 가능하다.Mistral은 모델 가중치, 코드, 학습 데이터셋 구성까지 GitHub에 공개했으며, Hugging Face와 연동해 누구나 1클릭으로 로컬·클라우드에서 실행할 수 있도록 지원한다. 특히 다국어(한국어 포함.. 2026. 3. 30.
Mistral, 기업용 커스텀 AI 플랫폼 ‘Forge’ 출시 데이터 완전 통제하며 자체 모델 구축 가능… 유럽 기업 시장 공략 프랑스 AI 스타트업 Mistral이 2026년 3월 22일 ‘Forge’ 플랫폼을 공식 론칭했다. Forge는 기업이 자사 데이터를 100% 프라이빗하게 유지하면서 전용 대형언어모델(LLM)을 구축·배포할 수 있는 엔터프라이즈급 솔루션이다. OpenAI나 AWS의 클라우드 의존을 벗어나 ‘유럽형 데이터 주권’을 강조하며 유럽 기업 시장을 집중 공략하고 있다.Forge의 특징은 ‘Zero-Data-Leak’ 아키텍처다. 모든 학습·추론 과정이 고객 전용 온프레미스 또는 Mistral 전용 VPC 안에서만 이뤄지며, Mistral 본사조차 데이터에 접근할 수 없다. 기업은 Mistral Large 2를 기반으로 미세 조정(Fine-tunin.. 2026. 3. 25.
Google Stitch AI, 디자인·건축 분야 대격변 일으켜 “디자이너 일자리 끝났다” 업계 충격… 초고속 자동화 도구 등장 구글이 2026년 3월 23일 Google I/O 사전 행사에서 ‘Stitch AI’를 공개하며 디자인과 건축 산업에 초대형 충격을 주고 있다. Stitch는 단 하나의 프롬프트로 UI/UX 디자인, 3D 모델링, 건축 도면, 인테리어 렌더링, 심지어 실시간 협업 수정까지 모두 처리하는 통합 AI 플랫폼이다. 기존 Figma·Adobe·AutoCAD·Revit을 한 번에 대체할 수 있을 정도로 강력하다.Stitch의 핵심은 ‘Multi-Layer Generative Engine’으로, Gemini 2.5 Ultra를 기반으로 1초 만에 4K 해상도 3D 모델과 실시간 물리 시뮬레이션을 생성한다. 예를 들어 “미니멀리즘 스타일의 50층 스마트.. 2026. 3. 25.
OpenAI, AI 비디오 플랫폼 Sora 공식 중단 발표 제품 포커스 재조정을 이유로 Sora 서비스 종료 OpenAI가 2026년 3월 24일(현지시간) 공식 블로그를 통해 AI 비디오 생성 플랫폼 ‘Sora’의 서비스를 전격 중단한다고 발표했다. 2024년 말 프리뷰 형태로 공개된 이후 폭발적인 관심을 끌었던 Sora는 텍스트 프롬프트만으로 최대 60초 길이의 고품질 영상을 생성하는 혁신적인 도구였으나, 이번 결정으로 모든 사용자에게 4월 30일까지 유예 기간을 주고 완전 종료될 예정이다.OpenAI CEO 샘 알트만은 발표문에서 “Sora는 초기 비전 달성에 성공했으나, 이제는 보다 안정적이고 확장 가능한 핵심 제품군(GPT 시리즈, o1 모델, Agent 프레임워크)에 집중해야 할 시점”이라고 밝혔다. 실제로 최근 Sora Gold Live(실시간 스트.. 2026. 3. 25.
반응형