반응형 옴니모달1 알리바바, 옴니모달 'Qwen3.5-Omni' 기습 공개… 구글·오픈AI에 도전장 영상·음성만으로 코딩 척척... 제미나이 3.1 Pro와 대등한 성능 확보 중국 알리바바가 텍스트, 이미지, 오디오, 비디오를 동시에 처리하는 강력한 옴니모달(Omni-modal) AI 모델 'Qwen3.5-Omni'를 공개하며 글로벌 선두권과의 격차를 좁혔다. 특히 별도의 코딩 학습 없이 시각 정보와 음성 지시만으로 복잡한 프로그램을 설계하는 능력을 선보여 업계를 놀라게 했다.Qwen3.5-Omni는 구글의 '제미나이 3.1 Pro'와 대등하거나 일부 지표에서는 이를 상회하는 성능을 보여주는 것으로 나타났다. 가장 큰 특징은 실시간 스트리밍 대화 능력이다. 사용자가 카메라로 주변 환경을 보여주며 실시간으로 질문하면, AI가 즉각적인 오디오 피드백과 함께 관련 정보를 인터넷에서 검색해 답변한다. 이는 구.. 2026. 4. 4. 이전 1 다음 반응형