본문 바로가기
반응형

ai뉴스4

구글 딥마인드, ‘비전 바나나’ 공개…이미지 생성 AI가 시각 이해까지 수행 객체 분할·깊이 추정 등 2D·3D 비전 과제에서 전문 모델과 경쟁 구글 딥마인드 연구진이 이미지 생성 모델을 기반으로 시각 이해 작업까지 수행하는 통합 모델 ‘비전 바나나’를 공개했다. 연구진은 이미지 생성 학습이 대형언어모델의 사전학습처럼 시각 세계에 대한 일반화된 표현을 형성할 수 있다고 설명했다. 비전 바나나는 나노 바나나 프로를 기반으로 소량의 시각 과제 데이터를 추가 학습해 만들어졌다. 비전 바나나는 이미지 속 서로 다른 사물을 색으로 구분하는 의미론적 분할, 같은 종류의 사물을 개별적으로 나누는 객체 분할, 사진 속 물체의 깊이를 추정하는 3D 이해 작업 등을 수행한다. 매일경제 보도에 따르면 기존에는 이런 작업을 위해 각 기능에 특화된 별도 비전 모델을 사용하는 경우가 많았지만, 비전 바.. 2026. 4. 26.
제미나이, 외부망 없이 사내 구축형으로 구동…AI 인프라 새 전환점 시라스케일, 구글 분산 클라우드 기반 프라이빗 제미나이 공개 구글의 AI 모델 제미나이를 인터넷 연결 없이 온프레미스 환경에서 사용할 수 있는 시스템이 공개됐다. 클라우드 서비스 기업 시라스케일은 구글 분산 클라우드, GDC 기반으로 제미나이를 사내 구축형 형태로 제공한다고 밝혔다. 이 시스템은 기업과 정부가 데이터 통제권을 유지하면서도 고성능 AI를 활용할 수 있도록 설계됐다.시라스케일이 공개한 시스템은 고성능 가속 서버에 제미나이 모델을 최적화해 탑재하는 방식이다. AI타임스 보도에 따르면 8개의 엔비디아 GPU가 장착된 서버 형태로 제공되며, 완전히 인터넷과 분리된 환경에서도 운용할 수 있다. 현재는 프리뷰 단계이며 정식 출시는 올해 중반으로 예상된다. 이번 기술의 핵심은 데이터 주권이다. 금융, .. 2026. 4. 26.
Anthropic, 차세대 AI 모델 ‘Claude 4’ 공개…AI 에이전트 시대 본격화 “코딩·문서작성·복잡업무까지”…Claude Opus 4, AI 활용의 새 표준 제시아마존 등 대형 투자자 주목…AI 시장 경쟁 구도 재편 신호탄 Anthropic(앤트로픽)이 2025년 5월 22일, 자사의 최신 인공지능 모델 ‘Claude 4’ 시리즈를 공식 발표했다. 이번 신제품은 복잡한 데이터 분석, 장시간 업무 자동화, 고품질 코딩 등에서 기존 AI 한계를 뛰어넘으며, 글로벌 AI 시장의 경쟁 구도에 중대한 변화를 예고했다. 미국 AI 스타트업 Anthropic이 5월 22일(현지시간) ‘Claude 4’ 시리즈를 공개했다. 이번에 발표된 ‘Claude Opus 4’와 ‘Claude Sonnet 4’는 각각 “AI 에이전트의 새로운 표준”을 제시하며, 수천 개의 데이터 소스 분석, 장시간 연속 작.. 2025. 5. 23.
OpenAI, GPT-4.1 모델 ChatGPT에 공식 도입…AI 대중화 가속 GPT-4.1, 프로그래밍·지시 이행 능력 대폭 향상일반 사용자도 ‘더 똑똑해진’ AI 경험 가능 OpenAI가 최신 인공지능 언어모델 GPT-4.1을 ChatGPT에 공식 도입했다. 이번 업데이트로 일반 사용자들도 한층 향상된 AI의 성능을 경험할 수 있게 됐다. 전문가들은 이번 조치가 AI 대중화에 중요한 전환점이 될 것으로 평가한다. OpenAI는 최근 GPT-4.1 모델을 ChatGPT에 적용했다고 공식 발표했다. 이번 조치로 Plus, Pro, Team 사용자는 ‘More models’ 메뉴에서 GPT-4.1을 직접 선택할 수 있으며, Enterprise 및 Edu 사용자는 곧 해당 기능을 이용할 수 있다. 주요 변화 및 특징구분GPT-4.1 주요 특징기존 GPT-4o와의 차이점프로그래밍코드 .. 2025. 5. 15.
반응형