Perplexity가 직접 만든 검색 특화 언어 모델로, 답변할 때 실시간으로 웹을 뒤져 출처가 달린 답을 빠르게 내놓는다.
보통의 언어 모델은 학습이 끝난 시점까지의 지식만 머릿속에 담고 있어서, 최신 뉴스나 오늘 일어난 일을 물으면 모르거나 지어낸다. Perplexity Sonar는 이 약점을 정면으로 겨냥한 모델이다. AI 검색 서비스로 유명한 Perplexity가 자체 개발했고, Meta의 Llama 3.3 70B를 가져와 "질문이 들어오면 일단 웹을 검색해서 그 결과를 근거로 답한다"는 방향으로 추가 훈련했다. 그래서 답변마다 어디서 가져온 정보인지 출처 링크가 본문에 함께 붙는다.
다른 모델과 비교하면 성격이 분명하다. 거대한 추론 모델처럼 어려운 수학이나 코딩을 푸는 게 목적이 아니라, "방금 일어난 일을 출처와 함께 정확하고 빠르게 알려주기"에 특화돼 있다. Cerebras의 전용 추론 칩 위에서 돌아가 초당 수백~1,200토큰 수준으로 답을 쏟아낼 만큼 빠르고, 같은 검색 용도에서는 가볍고 저렴한 모델로 분류된다.
가장 흔한 사용처는 자기 앱에 "실시간 정보 검색" 기능을 붙이는 것이다. 예전에는 최신 정보를 답하게 하려면 검색 엔진 API를 따로 붙이고, 결과를 긁어와 정리한 뒤 다시 LLM에 넘기는 RAG 파이프라인을 손수 만들어야 했다. Sonar는 이 과정을 모델 하나로 합쳤다. chat completions 형태의 API에 질문만 던지면 모델이 알아서 웹을 검색하고, 출처가 달린 답을 돌려준다. 검색을 얼마나 깊게 할지 High/Medium/Low로 골라 속도와 정확도를 맞출 수 있고, 검색 대상 도메인도 지정할 수 있다.
예를 들어 주식 앱에서 "오늘 이 종목이 왜 떨어졌어?"라고 물으면, Sonar가 방금 올라온 뉴스를 찾아 출처와 함께 요약해주는 식이다. 더 복잡하고 긴 조사가 필요하면 검색 결과를 2배 더 끌어오는 Sonar Pro 같은 상위 모델을 함께 쓴다. Perplexity 앱 자체의 기본 검색 모델이기도 해서, 무료 사용자가 빠른 답을 받을 때 뒤에서 돌아가는 것도 바로 이 Sonar다.
Sonar는 만능 모델이 아니다. 출처 기반 검색 답변에 최적화된 만큼, 긴 추론이나 창의적 글쓰기, 복잡한 코딩에서는 같은 회사가 끌어다 쓰는 GPT나 Claude 계열 모델보다 약하다. Perplexity 앱이 사실상 여러 외부 모델을 골라 쓰는 구조라는 점에서, Sonar는 그중 "빠른 검색 전용" 카드라고 이해하면 된다.