Kling AI 2.0 출시: 멀티모달 편집 기능으로 AI 스토리텔링의 새 지평 열어

2,200만 사용자 돌파, '비전에서 스크린으로' AI 콘텐츠 제작 혁신
새로운 인터랙티브 개념 'MVL' 도입, 개발자 생태계 확장 가속

지난 4월 15일, 베이징에서 열린 "비전에서 스크린으로(From Vision to Screen)" 런칭 이벤트를 통해 최첨단 생성 AI 기술 기업 Kling AI가 모델 2.0 업그레이드를 발표했습니다. 이번 발표에서는 KLING 2.0 비디오 생성 모델과 KOLORS 2.0 이미지 생성 모델이 공식적으로 전 세계에 공개되었으며, 이는 2,200만 명 이상의 글로벌 사용자를 기반으로 AI 스토리텔링의 새로운 가능성을 제시합니다.

특히, 이미지와 비디오 클립 등 다중 정보를 통합하여 복잡한 창작 아이디어를 AI에 효율적으로 전달하는 멀티모달 시각 언어(MVL: Multi-modal Visual Language) 개념이 새롭게 도입되어 주목받고 있습니다.

Kling AI

klingai.com

향상된 모델 성능과 혁신적인 기능

Kling AI는 작년 6월 출시 이후 20번 이상의 반복 개발을 거듭하며 모델의 기본 역량 강화, 이미지 품질 향상, 사용자 요구 충족을 위한 혁신적인 기능 도입에 집중해왔습니다. Kuaishou의 수석 부사장이자 커뮤니티 과학 부문 책임자인 Gai Kun은 "Kling AI는 모든 사람이 AI로 매력적인 이야기를 전달할 수 있도록 지원하여 더 정밀하고 복잡한 창의적 표현을 가능하게 하는 것을 목표로 한다"고 밝혔습니다.

최신 업그레이드를 통해 KLING 2.0 모델은 역동성, 프롬프트 준수, 시각적 미학 측면에서 글로벌 리더십을 더욱 공고히 했습니다. KOLORS 2.0 모델은 프롬프트 준수 능력, 영화 같은 시각적 품질, 예술적 스타일 표현(60가지 이상 스타일 지원)에서 크게 향상되었습니다. Kling AI 팀의 내부 다중 지표 비교 평가에 따르면 두 모델 모두 업계 최고 수준을 기록했습니다.

실제로 글로벌 AI 벤치마크 기관인 Artificial Analysis가 3월 27일에 검증한 비디오 생성 모델 순위에서 Kuaishou의 Kling 1.6 Pro(고품질 모드)는 1000점 이상의 벤치마크 Arena ELO 점수로 이미지-비디오 부문 1위를 차지했습니다.

'멀티모달 시각 언어(MVL)'와 새로운 편집 기능

이번 2.0 모델 업데이트에서 Kling AI는 AI 비디오 생성을 위한 새로운 인터랙티브 개념인 멀티모달 시각 언어(MVL)를 공식적으로 선보였습니다. 이는 사용자가 이미지 레퍼런스, 비디오 클립과 같은 다중 모드 정보를 통합하여 정체성, 외모, 스타일, 장면, 액션, 표정, 카메라 움직임 등 복잡하고 다차원적인 창의적 아이디어를 AI에 직접 효율적으로 전달할 수 있게 합니다.

이 새로운 MVL 개념을 기반으로, Kuaishou의 부사장이자 Kling AI 책임자인 Zhang Di는 완전히 새로운 '멀티 엘리먼트 에디터(Multi-Elements Editor)'와 '이미지 편집(Image Editing)' 기능을 공개했습니다. '멀티 엘리먼트 에디터'는 기존 비디오를 기반으로 텍스트나 이미지 입력을 통해 비디오 내 요소를 교체, 추가 또는 삭제할 수 있게 하여 제작자에게 더 많은 창의적 자유와 편집 유연성을 제공합니다.

Zhang Di는 "현재 Kling AI 비디오 제작의 약 85%가 이미지-비디오 생성 방식이며, 이미지 품질이 비디오 생성 과정에서 결정적인 역할을 한다"고 강조했습니다. 이미지 생성 모델 분야에서도 Kuaishou의 KOLORS 2.0은 업계를 선도하고 있으며, 텍스트-이미지 기능이 포괄적으로 업그레이드되어 프롬프트 준수 능력이 크게 향상되었고, 영화적 미학 표현이 강화되었으며, 60가지 이상의 이미지 변환 스타일을 지원합니다. 이를 통해 이미지 생성 시 모델의 창의성과 상상력이 크게 향상되었습니다.

AI 콘텐츠 생성의 활력과 산업적 영향

Kling AI는 최종 사용자를 위한 구독 서비스(to C) 외에도 기업 고객(to B)에게 API 통합 및 기타 서비스를 제공합니다. 현재 Xiaomi, Amazon Web Services, Alibaba Cloud, Freepik, BlueFocus 등 수천 개의 국내외 기업 고객과 파트너십을 맺고 있습니다.

Gai Kun은 "전 세계 15,000명 이상의 개발자가 Kling의 API를 다양한 산업 시나리오에 적용했으며, 총 약 1,200만 개의 이미지가 생성되고 4,000만 개 이상의 비디오 콘텐츠가 제작되었다"고 밝혔습니다. Kling AI는 AI 시대의 새로운 비디오 제작 인프라로 자리매김하고 있으며, 생성 AI 기술의 급속한 발전은 광고 및 마케팅, 전문 창작, 영화, 엔터테인먼트 등 여러 산업을 재편하고 있습니다.

AI 애호가들의 창의적인 열정을 더욱 고취시키기 위해 Zhang Di는 "Kling AI NextGen Initiative" 프로그램을 발표했습니다. 이 프로그램은 수백만 달러의 자금 지원, 글로벌 프로모션, 개인 브랜딩 구축, 최신 기능 우선 접근 기회 등을 제공하여 AI 영화 제작자들을 지원하는 것을 목표로 합니다.

참고링크

TechBullion 기사 원문: Kling AI 2.0 Launches with Multimodal Video/Image Editing: more than 22M Users Redefine AI Storytelling
Kling AI 공식 웹사이트: https://klingai.com/

#KlingAI #KlingAI2 #Kuaishou #AI #인공지능 #비디오생성AI #이미지생성AI #멀티모달AI #MVL #생성AI #AI편집 #AI스토리텔링 #콘텐츠제작 #기술혁신 #AI뉴스

저작자표시 비영리 (새창열림)

'IT' 카테고리의 다른 글

OpenAI, 'Flex 처리' API 출시... 비용 절반↓, 속도는 ↓ (0)	2025.04.18
퍼플렉시티 AI, 삼성·모토로라 스마트폰 탑재 눈앞… 구글 아성에 도전 (0)	2025.04.18
코히어, 복잡한 기업 문서 검색 위한 멀티모달 AI 'Embed 4' 공개 (0)	2025.04.17
OpenAI, 터미널용 오픈소스 코딩 도우미 'Codex CLI' 공개 (0)	2025.04.17
구글, AI 비디오 생성 모델 'Veo 2' 공개… Gemini와 Whisk 통해 사용 가능 (0)	2025.04.17

달달한 하루

Kling AI 2.0 출시: 멀티모달 편집 기능으로 AI 스토리텔링의 새 지평 열어

향상된 모델 성능과 혁신적인 기능

'멀티모달 시각 언어(MVL)'와 새로운 편집 기능

AI 콘텐츠 생성의 활력과 산업적 영향

'IT' 카테고리의 다른 글

티스토리툴바

Kling AI 2.0 출시: 멀티모달 편집 기능으로 AI 스토리텔링의 새 지평 열어

향상된 모델 성능과 혁신적인 기능

'멀티모달 시각 언어(MVL)'와 새로운 편집 기능

AI 콘텐츠 생성의 활력과 산업적 영향

'IT' 카테고리의 다른 글

관련글

티스토리툴바