앤트로픽의 가장 작고 빠른 클로드 모델로, 한 세대 전 중형 모델(Sonnet 4) 수준의 똑똑함을 1/3 비용과 훨씬 빠른 속도로 제공한다.
Claude Haiku 4.5는 앤트로픽이 2025년 10월 내놓은 클로드 제품군의 막내 모델이다. 클로드는 덩치와 가격에 따라 Opus(가장 똑똑하고 비싼), Sonnet(중간), Haiku(가장 작고 빠른) 세 가지로 나뉘는데, Haiku가 그중 제일 가볍다. 재미있는 점은, 불과 몇 달 전만 해도 최고 수준으로 여겨지던 Sonnet 4의 성능을 이 작은 모델이 거의 그대로 따라잡았다는 것이다. 즉 "얼마 전의 최첨단을 이제는 더 싸고 더 빠르게" 쓸 수 있게 된 셈이다.
가장 큰 차별점은 속도와 비용이다. 입력 100만 토큰당 1달러, 출력 100만 토큰당 5달러로 Sonnet 4.5(3달러/15달러)의 약 1/3 가격이면서, 응답이 눈에 띄게 빠르다. 그러면서도 코딩 실력 평가인 SWE-bench Verified에서 73%를 넘겨, 세계 최고 수준 코딩 모델 바로 아래까지 따라붙는다.
또 하나, Haiku 계열로는 처음으로 확장된 사고(extended thinking)가 들어갔다. 답을 내놓기 전에 단계를 밟아 "생각"하는 시간을 조절할 수 있다는 뜻으로, 그동안 큰 모델에서만 쓰던 깊은 추론을 작은 모델에서도 골라 쓸 수 있다. 화면을 보고 마우스·키보드를 조작하는 컴퓨터 사용(computer use) 능력도 갖췄다.
API에서 claude-haiku-4-5 모델명으로 바로 호출할 수 있고, Amazon Bedrock이나 GitHub Copilot의 모델 선택기에서도 고를 수 있다. 실제로 많이 쓰는 방식은 역할 분담이다. 챗봇 응대나 대량 분류처럼 빠른 응답이 중요하고 양이 많은 작업은 Haiku에게 맡겨 비용을 아끼고, 정말 어려운 판단만 Sonnet이나 Opus에게 넘긴다.
멀티 에이전트 구조에서는 이 장점이 더 두드러진다. 여러 개의 서브에이전트를 동시에 돌려 파일을 읽고 코드를 고치게 할 때, 각 일꾼을 Haiku로 채우면 같은 비용으로 훨씬 많은 작업을 병렬로 처리할 수 있다. Claude Code 사용자들 사이에서는 일상적인 코딩 작업 대부분을 Haiku로 처리하다가, 모델이 막히기 시작하면 Sonnet으로 갈아타는 식의 활용이 자리잡았다.
아무리 가까워졌다 해도 가장 똑똑한 모델은 아니다. 복잡한 설계 판단이나 까다로운 디버깅처럼 깊은 추론이 필요한 일에서는 여전히 Sonnet·Opus가 더 안정적이다. 빠르고 싸다는 장점을 살려 "적재적소"에 배치하는 게 핵심이다.