반응형 TrueBench1 삼성전자, AI 업무 생산성 측정 지표 ‘트루벤치’ 개발 정확성·속도·비용 등 종합 평가…AI 모델 도입 기준 제시'할루시네이션' 문제 해결 목표, LLM 도입 속도 높일 듯 삼성전자가 업무용 AI(인공지능) 모델의 생산성을 객관적으로 측정하고 평가하는 새로운 지표인 '트루벤치(TrueBench)'를 개발했다고 25일 밝혔다. 이는 실제 업무 환경에서 대규모언어모델(LLM)의 효용성을 정확하게 판단하고 도입 기준을 제시하기 위한 목적으로 개발되었다.최근 기업들은 업무 효율을 높이기 위해 LLM 기반의 생성형 AI 기술 도입을 적극적으로 검토하고 있으나, AI 모델의 성능을 실제 업무 생산성 향상으로 객관적으로 연결할 수 있는 기준이 부족하다는 지적이 꾸준히 제기되어 왔다. 특히 AI가 그럴듯한 거짓 정보를 생성하는 '할루시네이션(환각)' 문제 등으로 인해 도입.. 2025. 9. 26. 이전 1 다음 반응형