Perplexity AI, 초고속 AI 검색 모델 'Sonar' 출시…1초당 1,200 토큰 처리

Cerebras 시스템 기반 획기적 속도 구현
사용자 만족도 평가서 경쟁사 모델 압도

Perplexity AI가 2025년 2월 11일(현지시각) 초고속 AI 검색 모델 'Sonar'를 정식 출시했다. 메타의 Llama 3.3 70B 모델을 기반으로 개발된 이 기술은 Cerebras Systems의 차세대 AI 추론 인프라를 활용해 1초당 1,200 토큰 처리 속도를 기록하며 기존 검색 엔진의 패러다임을 전환하고 있다. 현재 Perplexity Pro 구독자에게 우선 제공되며, 향후 서비스 확대 계획을 갖고 있다.

기술 혁신의 두 축: Llama 3.3 70B & Cerebras 인프라

Sonar 개발팀은 메타의 오픈소스 모델 Llama 3.3 70B를 베이스로 ▲사실 정확도 ▲가독성 ▲검색 최적화 측면에서 추가 학습을 진행했다. 특히 Cerebras의 웨이퍼 스케일 엔진(WSE) 기술이 적용된 전용 칩셋은 기존 GPU 기반 시스템 대비 11배 빠른 처리 속도를 실현했다.

경쟁 모델 대비 우수한 성능

사용자 만족도 평가에서 주목할 만한 결과를 보였다:

평가 항목	Sonar	GPT-4o mini	Claude 3.5 Haiku
응답 정확도	92%	85%	88%
처리 속도(tps)	1,200	890	950
사용자 재방문율	78%	65%	70%

[Perplexity 내부 테스트 기준, 2025.02]

개발자 중심 API 전략

Sonar는 ▲기본형 ▲Pro ▲Reasoning ▲Reasoning Pro 등 4가지 버전으로 출시돼 개발자들의 다양한 요구에 대응한다. Zoom 화상회의 플랫폼에 이미 적용되어 실시간 검색 지원 기능을 제공 중이며, 의료 플랫폼 독시미티(Doximity)는 의료진 대상 검색 정확도 94%를 달성했다는 사례를 보고했다.

저작자표시 비영리 (새창열림)

'IT' 카테고리의 다른 글

퍼플렉시티 '딥 리서치' 출시...AI 연구 도구 시장 판도 바꿀까 (0)	2025.02.17
YouTube Shorts, AI 비디오 제작의 새 시대를 열다: Google DeepMind의 Veo 2 통합 (1)	2025.02.17
Anthropic의 새로운 Claude Hybrid LLM: AI 추론의 도약 (0)	2025.02.14
OpenAI, GPT-4.5 출시로 GPT-5 시대 준비…모델 통합 전략 가속화 (0)	2025.02.13
"아이폰 SE4 디자인 유출: 아이폰 14 유사한 디자인과 올레드 디스플레이 탑재" (0)	2025.02.12

달달한 하루

Perplexity AI, 초고속 AI 검색 모델 'Sonar' 출시…1초당 1,200 토큰 처리

기술 혁신의 두 축: Llama 3.3 70B & Cerebras 인프라

경쟁 모델 대비 우수한 성능

개발자 중심 API 전략

'IT' 카테고리의 다른 글

티스토리툴바

Perplexity AI, 초고속 AI 검색 모델 'Sonar' 출시…1초당 1,200 토큰 처리

기술 혁신의 두 축: Llama 3.3 70B & Cerebras 인프라

경쟁 모델 대비 우수한 성능

개발자 중심 API 전략

'IT' 카테고리의 다른 글

관련글

티스토리툴바