서울대, LLM 가치관 자동 조율하는 '밸류플로우' 프레임워크 개발

국제머신러닝학회(ICML 2026) 오럴 발표 논문 선정… 공정성·안전 등 다원적 가치 제어
AI 응답 방향성과 강도를 '표현-측정-조정' 3단계로 제어해 투명한 AI 개발 기여

서울대학교 컴퓨터공학부 도재영 교수 연구팀이 대형언어모델(LLM)이 생성하는 답변의 핵심 방향성을 인간의 가치관에 부합하도록 자동으로 측정하고 유연하게 조율할 수 있는 통합 AI 조율 기술인 '밸류플로우(VALUEFLOW)' 프레임워크를 독자 개발하는 쾌거를 거뒀다.

연구팀에 따르면, 이 혁신적인 연구 성과는 글로벌 기계학습 및 AI 학계 최정상급 국제학술회의인 '국제머신러닝학회(ICML 2026)'에 구두 발표(Oral Presentation) 대상 우수 논문으로 최종 채택되는 큰 영예를 안았다.

그동안의 정렬(Alignment) 연구들은 단순히 편향을 걸러내는 수동적 필터링에 머물렀으나, '밸류플로우'는 LLM 내부의 은닉 상태를 분석하여 인공지능이 응답 시 표현해야 하는 자유, 공정성, 물리적 안전 등의 다원적 가치 강도를 '표현-측정-조정'의 유기적 3단계 메커니즘을 거쳐 통제한다. 이 기술은 가치관 편향성 시비를 해결하고, 모델의 원천적인 신뢰도를 대폭 높여 사용 환경에 맞춤형 가치 조절판을 부착한 듯한 유연성을 제공한다.

도재영 교수는 "밸류플로우는 AI 모델이 인간 사회의 규범과 다양한 공공 규제들을 투명하게 충족할 수 있도록 돕는 실질적인 해결책"이라며, 이번 기술을 발판 삼아 상용 AI 에이전트의 판단 투명성과 가치 일치성을 더 고도화할 것이라고 포부를 전했다.

출처:https://aidas.snu.ac.kr/news/2026-05-01-valueflow-has-been-accepted-to-icml-2026-as-a-spotlight/

AIDAS Lab

aidas.snu.ac.kr

저작자표시 비영리 (새창열림)

'IT' 카테고리의 다른 글

스페이스X, AI 코딩 '커서' 90조원에 전격 인수… 빅테크 시총 5위 등극 (0)	2026.06.17
세일즈포스, AI 에이전트 기업 '핀' 36억 달러 인수… '에이전트포스' 강화 (0)	2026.06.16
업스테이지, 'AI 토큰 경제' 승부수… 다음 포털 트래픽으로 수익화 가동 (0)	2026.06.16
스페이스X 나스닥 데뷔 첫날 25% 폭등… 기업가치 1.77조 달러 기록 (0)	2026.06.13
오픈AI 미공개 'GPT-5.6' 가중치 유출 정황… 개발자 진영 술렁 (0)	2026.06.13

달달한 하루

서울대, LLM 가치관 자동 조율하는 '밸류플로우' 프레임워크 개발

'IT' 카테고리의 다른 글

티스토리툴바

서울대, LLM 가치관 자동 조율하는 '밸류플로우' 프레임워크 개발

'IT' 카테고리의 다른 글

관련글

티스토리툴바