본문 바로가기
반응형

인공지능126

구글, AI 모델 성능 비교 위한 오픈소스 'LMEval' 프레임워크 공개 GPT-4o부터 Claude까지, 통합 벤치마킹으로 AI 모델 객관적 평가 가능멀티모달 지원과 안전성 분석 기능으로 차세대 AI 개발 가속화 구글이 대형 언어 모델과 멀티모달 AI 모델의 성능을 표준화된 방식으로 비교 평가할 수 있는 오픈소스 프레임워크 'LMEval'을 공개했다고 26일 발표했다. 이 도구를 통해 연구자와 개발자들은 GPT-4o, Claude 3.7 Sonnet, Gemini 2.0 Flash, Llama-3.1-405B 등 서로 다른 회사의 AI 모델들을 동일한 기준으로 체계적으로 평가할 수 있게 됐다.AI 모델 비교의 새로운 표준 제시그동안 AI 업계에서는 각 기업이 자체적인 API와 데이터 형식, 벤치마크 설정을 사용해 모델 간 객관적 비교가 어려웠다. 구글은 "LMEval이 이러.. 2025. 5. 27.
구글, 웹브라우징 AI 에이전트 ‘프로젝트 마리너’ 전격 공개 “AI가 직접 웹을 탐색한다”…구글, 인터넷 이용 방식의 대전환 예고최대 10개 동시작업·클라우드 기반…AI 에이전트 경쟁 본격화 구글이 2025년 5월 20일(현지시각) 미국 캘리포니아에서 열린 Google I/O 2025에서 웹브라우징 AI 에이전트 ‘프로젝트 마리너(Project Mariner)’의 대규모 공개를 발표했다. 이번 신기술은 사용자가 직접 웹사이트를 방문하지 않아도 AI가 대신 웹을 탐색하고 다양한 작업을 수행할 수 있도록 설계됐다. 구글은 AI 기반 인터넷 경험의 근본적 변화를 예고하며, 경쟁사들과의 차별화된 기술력을 강조했다. 구글은 프로젝트 마리너를 통해 사용자가 단순히 명령을 내리면 AI가 웹사이트를 방문해 티켓 예매, 장보기, 정보 검색 등 복수의 작업을 자동으로 처리할 수 있.. 2025. 5. 21.
일본 스타트업 사카나 AI, 뇌 영감 받은 시간 기반 AI 모델 개발 트랜스포머 공동 개발자가 설립한 기업의 혁신적 접근법기존 언어 모델과 차별화된 '연속적 사고 기계' 아키텍처 도쿄 기반 스타트업 사카나 AI가 뇌의 시간 처리 방식을 모방한 새로운 인공지능 시스템 '연속적 사고 기계(Continuous Thought Machine, CTM)'를 최근 발표했다. 트랜스포머 아키텍처 원저자 중 한 명인 리온 존스(Llion Jones)가 공동 설립한 이 회사는 2023년 설립 당시 자연에서 영감을 받은 AI 시스템 구축을 목표로 밝힌 바 있다. CTM은 기존 언어 모델과 달리 입력을 단일 정적 스냅샷으로 처리하는 대신 합성 뉴런이 시간에 따라 동기화되는 방식에 초점을 맞추고 있다. 이 모델은 전통적인 활성화 함수 대신 과거 활성화의 이력을 추적하는 '뉴런 수준 모델(NLMs.. 2025. 5. 19.
유타대학, 전례 없는 정확도의 AI 질병 예측 도구 공개 종단적 데이터 분석으로 85-99% 정확도 달성만성질환 조기 발견·맞춤형 예방 전략 가능해져 유타대학교 연구진이 인공지능을 활용해 증상이 나타나기 수년 전에 만성 및 진행성 질환 발병 여부를 예측하는 오픈소스 소프트웨어 도구인 'RiskPath'를 개발했다고 17일 발표했다. 이 기술은 여러 해에 걸쳐 수집된 건강 데이터의 패턴을 분석하여 85%에서 99%의 전례 없는 정확도로 위험군을 식별한다. 유타대학교 정신의학과와 헌츠먼 정신건강연구소가 지난주 발표한 국립정신보건연구소 후원 연구에 따르면, RiskPath는 인간이 이해할 수 있는 방식으로 복잡한 결정을 설명하도록 설계된 '설명 가능한 AI'를 활용한다. "설명 가능성이란 AI가 이 예측을 어떻게 수행했는지 인간이 이해할 수 있도록 충분히 설.. 2025. 5. 18.
OpenAI, GPT-4.1 모델 ChatGPT에 공식 도입…AI 대중화 가속 GPT-4.1, 프로그래밍·지시 이행 능력 대폭 향상일반 사용자도 ‘더 똑똑해진’ AI 경험 가능 OpenAI가 최신 인공지능 언어모델 GPT-4.1을 ChatGPT에 공식 도입했다. 이번 업데이트로 일반 사용자들도 한층 향상된 AI의 성능을 경험할 수 있게 됐다. 전문가들은 이번 조치가 AI 대중화에 중요한 전환점이 될 것으로 평가한다. OpenAI는 최근 GPT-4.1 모델을 ChatGPT에 적용했다고 공식 발표했다. 이번 조치로 Plus, Pro, Team 사용자는 ‘More models’ 메뉴에서 GPT-4.1을 직접 선택할 수 있으며, Enterprise 및 Edu 사용자는 곧 해당 기능을 이용할 수 있다. 주요 변화 및 특징구분GPT-4.1 주요 특징기존 GPT-4o와의 차이점프로그래밍코드 .. 2025. 5. 15.
트럼프, AI 학습 저작권 논란 속 저작권청장 전격 해임 일론 머스크 AI 사업과 연관성 제기돼저작권청, AI 학습 위한 무단 콘텐츠 사용 제한 필요성 언급한 보고서 발표 직후 해임 결정 도널드 트럼프 미국 대통령이 시라 펄머터(Shira Perlmutter) 미국 저작권청장을 전격 해임했다. 이번 해임은 저작권청이 인공지능(AI) 학습을 위한 저작권 콘텐츠 사용에 제한이 필요하다는 내용의 보고서를 발표한 직후 이루어져 논란이 일고 있다. CBS News와 Politico 등 주요 언론에 따르면, 트럼프 대통령은 지난 주말 저작권청장 해임을 결정했으며, 이는 펄머터 청장이 일론 머스크의 AI 모델 학습을 위한 저작권 작품 사용에 제동을 걸었다는 점과 연관이 있다는 의혹이 제기되고 있다. 미국 하원 행정위원회 민주당 간사인 조 모렐(Joe Morelle) 의원은.. 2025. 5. 13.
반응형