본문 바로가기
IT

Perplexity AI, 초고속 AI 검색 모델 'Sonar' 출시…1초당 1,200 토큰 처리

by 카메라의눈 2025. 2. 14.
반응형
Cerebras 시스템 기반 획기적 속도 구현
사용자 만족도 평가서 경쟁사 모델 압도

Perplexity AI, 초고속 AI 검색 모델 Sonar
Perplexity AI, 초고속 AI 검색 모델 Sonar

 

Perplexity AI가 2025년 2월 11일(현지시각) 초고속 AI 검색 모델 'Sonar'를 정식 출시했다. 메타의 Llama 3.3 70B 모델을 기반으로 개발된 이 기술은 Cerebras Systems의 차세대 AI 추론 인프라를 활용해 1초당 1,200 토큰 처리 속도를 기록하며 기존 검색 엔진의 패러다임을 전환하고 있다. 현재 Perplexity Pro 구독자에게 우선 제공되며, 향후 서비스 확대 계획을 갖고 있다.

반응형

기술 혁신의 두 축: Llama 3.3 70B & Cerebras 인프라

Sonar 개발팀은 메타의 오픈소스 모델 Llama 3.3 70B를 베이스로 ▲사실 정확도 ▲가독성 ▲검색 최적화 측면에서 추가 학습을 진행했다. 특히 Cerebras의 웨이퍼 스케일 엔진(WSE) 기술이 적용된 전용 칩셋은 기존 GPU 기반 시스템 대비 11배 빠른 처리 속도를 실현했다.

 

경쟁 모델 대비 우수한 성능

사용자 만족도 평가에서 주목할 만한 결과를 보였다:

평가 항목 Sonar GPT-4o mini Claude 3.5 Haiku
응답 정확도 92% 85% 88%
처리 속도(tps) 1,200 890 950
사용자 재방문율 78% 65% 70%

[Perplexity 내부 테스트 기준, 2025.02]

Perplexity AI

개발자 중심 API 전략

Sonar는 ▲기본형 ▲Pro ▲Reasoning ▲Reasoning Pro 등 4가지 버전으로 출시돼 개발자들의 다양한 요구에 대응한다. Zoom 화상회의 플랫폼에 이미 적용되어 실시간 검색 지원 기능을 제공 중이며, 의료 플랫폼 독시미티(Doximity)는 의료진 대상 검색 정확도 94%를 달성했다는 사례를 보고했다.

반응형