본문 바로가기
반응형

전체 글620

삼성, 700만 매개변수 '초소형 AI' TRM 개발…거대 모델 능가하는 추론 능력 GPT-4o Mini, Gemini 2.5 Pro 등 압도…ARC-AGI 벤치마크서 45% 달성 삼성전자 종합기술원 AI 랩(SAIL Montreal) 연구팀이 단 700만 개의 매개변수(파라미터)만을 가진 초소형 AI 모델 'TRM(Tiny Recursive Model)'을 개발하고, 복잡한 추론 능력 벤치마크인 ARC-AGI 테스트에서 대규모 언어 모델(LLM)들을 능가하는 성능을 보이며 AI 아키텍처 혁신을 입증했다. TRM은 삼성 SAIT 소속 Alexia Jolicoeur-Martineau 연구원이 발표한 논문 "Less is More: Recursive Reasoning with Tiny Networks"를 통해 공개되었다. 이 모델은 GPT-4o mini, Gemini 2.5 Pro와 같은 .. 2025. 10. 11.
OpenAI, '최고급 추론 모델' GPT-5 Pro 출시... 응답 토큰 27만 개로 확장 높은 정확성 대가로 느린 응답 속도와 비싼 비용 논란 인공지능(AI) 기업 OpenAI가 오늘(6일) DevDay 이벤트에서 플래그십 모델인 'GPT-5 Pro'를 API 전용으로 공식 출시하며 대규모 언어 모델(LLM) 시장에 새로운 표준을 제시했다. GPT-5 Pro는 GPT-5와 동일하게 2024년 9월 30일 지식 차단점과 40만 토큰의 컨텍스트 한도를 공유하지만, 최대 출력 토큰을 기존 128,000개에서 272,000개로 대폭 늘린 것이 특징이다. 이 모델은 OpenAI의 가장 진보된 추론 모델로, 'reasoning.effort: high' 설정을 기본이자 유일한 옵션으로 채택해 복잡한 문제에 대한 최고 수준의 추론 능력을 제공하는 데 집중한다. 느린 응답 속도와 높은 가격, 실사용 효율성 .. 2025. 10. 11.
앤트로픽 ‘클로드 소넷 4.5’, 보안 취약점 탐지 25%↑ 자율 패치 에이전트 구축 가능...취약점 대응 시간 44% 단축SWE-bench 77.2% 달성, 코딩 및 에이전트 분야 최고 성능 입증 AI 전문 기업 앤트로픽(Anthropic)이 신규 대규모 언어 모델(LLM)인 ‘클로드 소넷 4.5’를 공개하며 사이버 보안 분야에서 혁신적인 성과를 발표했다. 이 모델은 특히 보안 취약점 탐지 정확도를 25% 높였으며, 평균 취약점 처리 시간을 44% 단축해 기업의 선제적 방어 체계를 강화할 전망이다. 클로드 소넷 4.5는 향상된 하이브리드 추론(Hybrid Reasoning) 능력을 바탕으로 취약점이 악용되기 전에 자율적으로 패치하는 에이전트 구축을 가능하게 한다. 이는 기존의 사후 대응적 탐지 방식을 넘어 능동적인 보안 강화를 지원하는 중요한 발전으로 평가받는다.. 2025. 10. 6.
알리바바, Qwen3 컴팩트 멀티모달 모델 공개…GPT-4o 등과 경쟁 30억 활성 파라미터로 고성능 발휘, 수학·이미지 인식·에이전트 제어 강화FP8 버전 포함하여 오픈소스로 제공…HuggingFace, GitHub 등에서 이용 가능 중국 기술 대기업 알리바바(Alibaba)의 AI 연구 조직인 Qwen 팀이 'Qwen3-Omni' 계열의 새로운 소규모 멀티모달 모델 두 가지를 오픈소스로 공개했다. 이 모델들은 각각 30억 개의 활성 파라미터(3B active parameters)를 가졌음에도 불구하고, 대규모 모델인 GPT-4o 및 클로드 3 소네트(Claude 3 Sonnet)와 경쟁할 만한 고성능을 발휘한다고 발표했다. 새롭게 공개된 모델은 Qwen3-VL-30B-A3B-Instruct와 Qwen3-VL-30B-A3B-Thinking 버전이다. Qwen3 컴.. 2025. 10. 5.
OpenAI, 삼성·SK와 ‘스타게이트’ 동맹…5천억 달러 AI 인프라 구축 가속 샘 알트만, 방한 후 한국 기업과 파트너십 발표…반도체 및 데이터센터 협력삼성전자·SK하이닉스, 첨단 메모리 칩 생산 확대 약속 인공지능(AI) 챗봇 ChatGPT 개발사 OpenAI가 한국의 기술 대기업인 삼성 및 SK와 손잡고 대규모 AI 인프라 구축 프로젝트인 ‘스타게이트(Stargate)’를 추진한다고 발표했다. 이번 파트너십은 총 5천억 달러(약 680조 원) 규모로 알려진 스타게이트 프로젝트에 한국의 반도체 역량과 데이터센터 솔루션을 결합하는 것을 목표로 한다.이번 발표는 샘 알트만 OpenAI CEO가 이재명 대통령을 비롯한 한국 기업 관계자들과 서울에서 회동한 직후에 나왔다. 한국 기업과의 구체적인 협력 내용이번 파트너십에는 메모리 반도체 분야의 세계적 강자인 삼성전자와 SK하이닉스가 참여.. 2025. 10. 5.
구글, 제미나이 2.5 플래시 이미지 일반 공개...10가지 화면 비율 지원 확대 '나노 바나나' 코드명, 일관된 캐릭터 유지·자연어 정밀 편집 기능 강화개발자는 AI 스튜디오 및 Vertex AI에서 활용 가능, GIF 생성 기능도 추가 구글이 이미지 생성 및 편집 모델인 ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’를 일반 공개(GA)하고, 개발자 환경에서 즉시 사용할 수 있도록 했다. 코드명 ‘나노 바나나(Nano Banana)’로도 불리는 이 모델은 10가지에 달하는 다양한 화면 비율 지원과 함께 일관된 캐릭터 유지 등 창작의 자유도를 대폭 확장하는 신규 기능을 탑재했다. 이번 업데이트는 이미지 생성 및 편집 워크플로우를 가속화하고, 사용자가 시네마틱 풍경부터 소셜 미디어용 세로 이미지까지 다양한 플랫폼에 최적화된 콘텐츠를 쉽게 제작하도록 돕는 데.. 2025. 10. 5.
반응형