반응형 IT197 Perplexity AI, 초고속 AI 검색 모델 'Sonar' 출시…1초당 1,200 토큰 처리 Cerebras 시스템 기반 획기적 속도 구현사용자 만족도 평가서 경쟁사 모델 압도 Perplexity AI가 2025년 2월 11일(현지시각) 초고속 AI 검색 모델 'Sonar'를 정식 출시했다. 메타의 Llama 3.3 70B 모델을 기반으로 개발된 이 기술은 Cerebras Systems의 차세대 AI 추론 인프라를 활용해 1초당 1,200 토큰 처리 속도를 기록하며 기존 검색 엔진의 패러다임을 전환하고 있다. 현재 Perplexity Pro 구독자에게 우선 제공되며, 향후 서비스 확대 계획을 갖고 있다.기술 혁신의 두 축: Llama 3.3 70B & Cerebras 인프라Sonar 개발팀은 메타의 오픈소스 모델 Llama 3.3 70B를 베이스로 ▲사실 정확도 ▲가독성 ▲검색 최적화 측면에서 .. 2025. 2. 14. Anthropic의 새로운 Claude Hybrid LLM: AI 추론의 도약 'Claude 3.5 Sonnet' 기반 혁신적 리소스 할당 시스템 선보여...기업용 생성형 AI 시장 공략 가속화 인공지능 스타트업 Anthropic이 2월 14일(현지시각) 기존 대형언어모델(LLM)의 한계를 뛰어넘는 하이브리드 AI 모델을 발표했다. 이 모델은 사용자가 질문의 복잡도에 따라 컴퓨팅 리소스를 유동적으로 조절할 수 있는 '가변형 추론 스케일'을 도입, 단순 질문 처리 시 기존 모델 대비 2배 빠른 응답 속도를 구현했으며 복잡한 프로그래밍 과제에서는 경쟁사 모델을 능가하는 성능을 보였다."이번 혁신은 AI가 인간의 사고 방식을 모방하는 데서 한 단계 진화했다는 의미를 지닙니다."- 제임스 클라프 Anthropic 공동창립자 겸 CTO 2024년 3월 공개된 Claude 3 시리즈의 후속 .. 2025. 2. 14. OpenAI, GPT-4.5 출시로 GPT-5 시대 준비…모델 통합 전략 가속화 "단순화된 AI 경험" 강조하며 차세대 모델 로드맵 공개 오픈AI가 2025년 2월 12일(현지 시간) CEO 샘 올트먼을 통해 GPT-4.5를 몇 주 내 출시할 예정이며, GPT-5는 향후 몇 개월 안에 공개될 것이라고 발표했다. GPT-4.5는 "체인 오브 싱크(Chain-of-Thought, CoT)" 추론 기능이 없는 마지막 모델로, 이후 오픈AI는 기존 o-시리즈와 GPT-시리즈를 통합한 "단일화된 지능 체계"로 전환할 계획이다.1. GPT-4.5: 마지막 비-추론 모델의 의미GPT-4.5(코드명 Orion)은 기존 GPT-4o 대비 코딩 성능 향상은 제한적이지만, 추론 기능 없이도 복잡한 작업을 처리하는 데 최적화된 모델이다. 올트먼은 "GPT-4.5는 오픈AI가 체인 오브 싱크 없이 개발하는.. 2025. 2. 13. "아이폰 SE4 디자인 유출: 아이폰 14 유사한 디자인과 올레드 디스플레이 탑재" 애플의 '예산형' 아이폰, 최신 기술 담은 혁신적 변화 예고 애플의 차세대 예산형 아이폰인 '아이폰 SE4'의 디자인이 케이스 제조사 스피겐(Spigen)의 유출로 공개됐다. 출시를 앞두고 있는 이번 모델은 기존 SE 시리즈의 디자인을 완전히 탈피해 아이폰 14와 유사한 모던한 디자인과 최신 스펙을 탑재할 것으로 전망된다. 업계는 애플이 중저가 시장 공략을 위해 기기 성능과 디자인을 대폭 개선하며 공격적인 전략을 펼칠 것으로 분석하고 있다.케이스 유출로 확인된 디자인 변화스피겐은 공식 웹사이트에 아이폰 SE4 전용 케이스 이미지를 일시 게재했다가 삭제했으나, 해당 이미지는 SNS를 통해 급속도로 확산됐다. 유출된 자료에 따르면 아이폰 SE4는 다음과 같은 디자인 특징을 가진다:노치 디스플레이: 다이내믹 .. 2025. 2. 12. "딥시크보다 저렴해요" 구글, 차세대 AI '제미니 2.0' 전면 출시 가격 경쟁력·향상된 추론 능력 강화…"에이전트 시대 본격화"1M 토큰당 $0.075부터…中 딥시크 R1과의 가격 경쟁 주목 2025년 2월 5일, 구글이 차세대 AI 모델 제미니 2.0 시리즈를 전면 출시하며 생성형 AI 시장 경쟁에 새로운 지각변동을 예고했습니다. 특히 이번 출시에서 눈에 띄는 점은 ▲2백만 토큰 초대형 컨텍스트 윈도우 ▲실시간 코드 실행 기능 ▲중국계 AI 스타트업 딥시크(DeepSeek) 대비 경쟁력 있는 가격 정책입니다. 테크 업계는 "생산비 50% 절감 효과"(ABI 리서치)를 내세우는 구글의 공세가 글로벌 AI 시장 재편을 이끌 것이라 분석하고 있습니다.1. 가격 경쟁력: "딥시크 R1 대비 최대 30% 절약 가능"모델입력 토큰(1M)출력 토큰(1M)컨텍스트 윈도우제미니 2... 2025. 2. 12. Hugging Face, 새로운 소형 AI 모델 SmolLM2 출시 – Qwen, Llama 압도 SmolLM2, 성능으로 경쟁 모델 제압소형 모델로도 고성능 AI 구현 가능성 입증 Hugging Face가 최근 발표한 소형 언어 모델 SmolLM2가 AI 업계에서 주목받고 있습니다. 이 모델은 Qwen 및 Llama와 같은 경쟁 모델을 여러 지식 및 이해 벤치마크에서 능가하며, 특히 소형 크기와 높은 효율성으로 눈길을 끌고 있습니다. SmolLM2는 135M, 360M, 1.7B 파라미터로 구성된 세 가지 크기로 제공되며, 특히 1.7B 모델은 HellaSwag(68.7%), PIQA(77.6%) 등 주요 벤치마크에서 경쟁 모델인 Qwen2.5-1.5B와 Llama-1B를 능가했습니다. 이 모델은 Hugging Face의 데이터 중심 접근 방식을 통해 개발되었으며, 11조 개의 토큰 데이터셋과 Fi.. 2025. 2. 11. 이전 1 ··· 11 12 13 14 15 16 17 ··· 33 다음 반응형