본문 바로가기

하이브리드토크나이저1

애플, 이미지 이해·생성 통합 멀티모달 AI 모델 '만사노' 공개 하이브리드 토크나이저 채택... 기존 모델의 '이해·생성 성능 상충' 문제 완화300M에서 30B까지 확장 가능... 벤치마크서 통합 모델 중 최고 수준 기록 애플 연구팀이 이미지 이해와 생성을 하나의 모델에서 모두 수행하는 통합 멀티모달 대규모 언어 모델(LLM)인 '만사노(Manzano)'를 공개했다. 이 모델은 기존 통합 모델들이 양쪽 기능 중 하나에서 성능 저하를 겪는 문제를 해소하기 위해 '하이브리드 비전 토크나이저'라는 새로운 구조를 도입한 것이 특징이다.최근 인공지능(AI) 분야에서는 텍스트뿐만 아니라 이미지, 음성 등 다양한 형태의 데이터를 처리하고 생성하는 멀티모달(Multimodal) AI 모델 개발이 활발하다. 그러나 이미지를 텍스트로 이해하는(Understanding) 과정과, 텍.. 2025. 9. 28.

이전 1 다음

티스토리툴바