본문 바로가기
IT

아마존, 웹 브라우저 자동 제어하는 AI 에이전트 '노바 액트' 공개

by 카메라의눈 2025. 4. 1.
반응형
AI 에이전트 경쟁에 본격 뛰어든 아마존
경쟁사 대비 6% 성능 앞서... 알렉사 플러스에 이미 통합 중

노바 액트
Image Credits: Thos Robinson/Getty Images for The New York Times

 

미국 시애틀에 본사를 둔 글로벌 기술 기업 아마존이 2025년 3월 31일(현지시간) 웹 브라우저를 독립적으로 제어하고 작업을 수행할 수 있는 인공지능 에이전트 '노바 액트(Nova Act)'를 공개했다. 이 기술은 아마존이 최근 샌프란시스코에 설립한 AGI 연구소에서 개발했으며, 개발자들이 프로토타입을 구축할 수 있도록 노바 액트 SDK도 함께 출시했다.

 

노바 액트는 웹 브라우저 환경에서 사용자를 대신해 온라인 쇼핑, 양식 작성, 예약 등 다양한 작업을 자동으로 수행할 수 있다. 아마존에 따르면 이 AI 에이전트는 화면 텍스트와 상호작용하는 능력을 측정하는 ScreenSpot Web Text 테스트에서 94%의 점수를 기록했는데, 이는 OpenAI의 CUA(88%)와 Anthropic의 Claude 3.7 Sonnet(90%)보다 우수한 성능이다.

반응형

현재 연구 미리보기(Research Preview) 단계로 제공되는 노바 액트는 아마존의 인기 음성 비서 알렉사의 AI 기능이 강화된 버전인 '알렉사 플러스'의 주요 기능을 이미 구동하고 있다. 아마존은 또한 개발자와 기술 애호가들이 아마존의 노바 기반 모델을 탐색할 수 있는 새로운 웹사이트(nova.amazon.com)도 출시했다.

 

아마존의 AGI 자율성 부문 부사장인 데이비드 루안은 "우리는 에이전트가 범용 인공지능으로 가는 길에 마지막으로 남은 중요한 조각이라고 생각합니다"라고 밝혔다. 또한 아마존 AGI 수석 부사장 로힛 프라사드는 "아마존의 최첨단 인공지능 기술을 모든 개발자와 기술 애호가의 손에 쥐어줌으로써 아마존 노바의 기능을 더욱 쉽게 탐색할 수 있게 되었습니다"라고 강조했다.

amazon Nova
Nova Act

 

노바 액트 SDK를 사용하면 개발자들은 드롭다운 메뉴, 날짜 선택기, 팝업 대화상자와 같이 다른 AI 시스템이 종종 어려워하는 인터페이스 요소도 처리할 수 있는 에이전트를 구축할 수 있다. 특히 API에 의존하지 않고도 브라우저에서 단계별 작업을 완료할 수 있도록 설계되었다.

 

아마존은 노바 액트가 경쟁사 제품보다 속도가 빠르고 비용 효율성이 뛰어나 최대 75% 저렴하다고 주장하고 있다. 이번 출시로 아마존은 OpenAI, Google, Anthropic 등 다른 기술 대기업들과 함께 AI 에이전트 시장에서 경쟁력을 강화하게 되었다.

 

아마존의 노바 액트는 현재 개발자들을 위한 연구 미리보기로만 제공되지만, 향후 일반 소비자들도 이용할 수 있게 될 전망이다. 관심 있는 개발자들은 nova.amazon.com에서 API 키를 신청하여 노바 액트 SDK를 통해 자신만의 AI 에이전트를 개발할 수 있다. 아마존은 이 기술이 장기적으로 결혼식 계획이나 복잡한 IT 작업과 같은 다단계 작업을 수행할 수 있을 것으로 기대하고 있다.

반응형