본문 바로가기
IT

코히어, 복잡한 기업 문서 검색 위한 멀티모달 AI 'Embed 4' 공개

by 카메라의눈 2025. 4. 17.
반응형
텍스트, 이미지, 표 등 다양한 데이터 유형 처리… 100개 이상 언어 지원
온프레미스 및 프라이빗 클라우드 배포 가능… 민감 데이터 관리 용이

코히어(Cohere)
출처: 코히어(Cohere)

 

AI 스타트업 코히어(Cohere)가 재무 보고서, 의료 기록, 산업 문서 등 기업 내 복잡하고 다양한 형태의 문서를 효과적으로 검색할 수 있도록 설계된 새로운 멀티모달 언어 모델 Embed 4를 출시했다고 AI 전문 매체 THE DECODER가 보도했다.

 

Cohere releases Embed 4, a multimodal model for enterprise document search

Cohere has introduced Embed 4, a multimodal language model designed for semantic search across complex enterprise documents.

the-decoder.com

 

Embed 4는 기업 환경에서 흔히 발견되는 텍스트, 이미지, 표, 차트, 코드, 심지어 손으로 쓴 스캔 문서까지 광범위한 콘텐츠 유형을 처리할 수 있는 시맨틱 검색(semantic search) 기능을 제공한다. 이는 단순 키워드 매칭을 넘어 문서의 의미와 맥락을 이해하여 관련성 높은 정보를 찾아주는 고급 검색 방식이다.

 

이 모델은 최대 128,000 토큰(약 200페이지 분량)에 달하는 파일을 처리할 수 있으며, 한국어를 포함하여 아랍어, 프랑스어, 일본어 등 100개 이상의 언어를 지원하여 다국어 환경의 기업에서도 활용도가 높을 것으로 기대된다.

코히어에 따르면, Embed 4는 특히 기업 내부 지식에 접근해야 하는 언어 모델 기반 어시스턴트(AI 비서)를 구축하려는 조직에 유용하다. 예를 들어, 고객 지원 챗봇이 내부 기술 문서나 매뉴얼을 검색하여 정확한 답변을 제공하거나, 연구 개발팀이 과거 연구 보고서나 실험 데이터를 효율적으로 찾는 데 활용될 수 있다.

 

또한, Embed 4는 데이터 민감성이 높은 산업 분야의 요구 사항을 충족시키기 위해 온프레미스(기업 내부 서버 직접 설치) 또는 프라이빗 클라우드 환경에 배포할 수 있도록 설계되었다. 이는 의료, 금융, 제조 등 엄격한 데이터 보안 규정을 준수해야 하는 기업들에게 중요한 장점으로 작용할 전망이다.

현재 Embed 4는 코히어 자체 플랫폼뿐만 아니라, 마이크로소프트 애저 AI 파운드리(Microsoft Azure AI Foundry)아마존 세이지메이커(Amazon SageMaker)와 같은 주요 클라우드 AI 플랫폼을 통해서도 이용 가능하다. 이를 통해 더 많은 기업이 Embed 4의 강력한 멀티모달 검색 기능을 자사의 시스템과 워크플로우에 통합할 수 있게 되었다.

 

모든 데이터, 분석, AI의 중심 - Amazon SageMaker - AWS

Amazon SageMaker에서 설계부터 안전한 포괄적인 AI 개발 기능 세트를 사용하여 AI를 가속화합니다. 고성능이면서도 비용 효율적인 인프라에서 ML 및 파운데이션 모델(FM)을 훈련, 사용자 지정, 배포합

aws.amazon.com

 

반응형