AI안전성3 구글, AI 모델 성능 비교 위한 오픈소스 'LMEval' 프레임워크 공개 GPT-4o부터 Claude까지, 통합 벤치마킹으로 AI 모델 객관적 평가 가능멀티모달 지원과 안전성 분석 기능으로 차세대 AI 개발 가속화 구글이 대형 언어 모델과 멀티모달 AI 모델의 성능을 표준화된 방식으로 비교 평가할 수 있는 오픈소스 프레임워크 'LMEval'을 공개했다고 26일 발표했다. 이 도구를 통해 연구자와 개발자들은 GPT-4o, Claude 3.7 Sonnet, Gemini 2.0 Flash, Llama-3.1-405B 등 서로 다른 회사의 AI 모델들을 동일한 기준으로 체계적으로 평가할 수 있게 됐다.AI 모델 비교의 새로운 표준 제시그동안 AI 업계에서는 각 기업이 자체적인 API와 데이터 형식, 벤치마크 설정을 사용해 모델 간 객관적 비교가 어려웠다. 구글은 "LMEval이 이러.. 2025. 5. 27. 앤트로픽, 챗봇에서 복잡한 AI 과제로 전환…AI 산업의 새 지평 열다 앤트로픽, 챗봇 시대 마감 선언…복잡한 연구·프로그래밍에 집중새로운 클로드 4, 에이전트 기반 응용에 초점…안전성 강화와 매출 급증AI 스타트업 앤트로픽이 챗봇 중심 전략을 공식적으로 종료하고, 복잡한 연구 및 프로그래밍 등 고차원적 과제에 집중하기로 했다. 이는 AI 산업 내 기술 진화와 시장 요구 변화에 따른 전략적 전환으로 평가된다.구분기존 전략(챗봇)신규 전략(복잡한 과제)주요 제품챗봇클로드 4, 에이전트타깃 시장일반 사용자개발자, 연구자매출10억 달러20억 달러(2배 증가)안전성일반적강화된 안전성앤트로픽의 과학 책임자 Jared Kaplan은 최근 인터뷰에서 “챗봇 시대는 끝났다. 이제는 연구, 프로그래밍 등 복잡한 과제에 집중할 것”이라고 밝혔다. 실제로 최신 클로드 4 모델은 에이전트 기반 .. 2025. 5. 26. Mistral, AI 기반 콘텐츠 조정 API 출시로 온라인 안전성 강화 AI 스타트업 Mistral이 콘텐츠 조정을 위한 새로운 API를 출시했습니다. 이 API는 Mistral의 Le Chat 챗봇 플랫폼에서 사용되는 동일한 시스템을 기반으로 하며, 특정 애플리케이션과 안전 표준에 맞게 조정할 수 있습니다. 이 API는 영어, 프랑스어, 독일어 등 다양한 언어로 된 텍스트를 9가지 카테고리로 분류하도록 훈련된 Ministral 8B 모델을 사용하여 성적, 증오 및 차별, 폭력 및 위협 등 유해한 콘텐츠를 감지합니다. API의 주요 기능Mistral의 새로운 콘텐츠 조정 API는 Le Chat 챗봇 플랫폼에서 이미 사용되고 있는 기술을 기반으로 하며, 원시 텍스트와 대화형 텍스트 모두에 적용될 수 있습니다. 이 API는 성적 콘텐츠, 증오 및 차별, 폭력 및 위협, 위험한 .. 2024. 11. 8. 이전 1 다음