모델

클로드 하이쿠 4.5

Claude Haiku 4.5 (Anthropic)

앤트로픽의 가장 작고 빠른 클로드 모델로, 한 세대 전 중형 모델(Sonnet 4) 수준의 똑똑함을 1/3 비용과 훨씬 빠른 속도로 제공한다.

어떤 모델인가

Claude Haiku 4.5는 앤트로픽이 2025년 10월 내놓은 클로드 제품군의 막내 모델이다. 클로드는 덩치와 가격에 따라 Opus(가장 똑똑하고 비싼), Sonnet(중간), Haiku(가장 작고 빠른) 세 가지로 나뉘는데, Haiku가 그중 제일 가볍다. 재미있는 점은, 불과 몇 달 전만 해도 최고 수준으로 여겨지던 Sonnet 4의 성능을 이 작은 모델이 거의 그대로 따라잡았다는 것이다. 즉 "얼마 전의 최첨단을 이제는 더 싸고 더 빠르게" 쓸 수 있게 된 셈이다.

무엇을 잘하나

가장 큰 차별점은 속도와 비용이다. 입력 100만 토큰당 1달러, 출력 100만 토큰당 5달러로 Sonnet 4.5(3달러/15달러)의 약 1/3 가격이면서, 응답이 눈에 띄게 빠르다. 그러면서도 코딩 실력 평가인 SWE-bench Verified에서 73%를 넘겨, 세계 최고 수준 코딩 모델 바로 아래까지 따라붙는다.

또 하나, Haiku 계열로는 처음으로 확장된 사고(extended thinking)가 들어갔다. 답을 내놓기 전에 단계를 밟아 "생각"하는 시간을 조절할 수 있다는 뜻으로, 그동안 큰 모델에서만 쓰던 깊은 추론을 작은 모델에서도 골라 쓸 수 있다. 화면을 보고 마우스·키보드를 조작하는 컴퓨터 사용(computer use) 능력도 갖췄다.

개발자가 언제 어떻게 쓰나

API에서 claude-haiku-4-5 모델명으로 바로 호출할 수 있고, Amazon Bedrock이나 GitHub Copilot의 모델 선택기에서도 고를 수 있다. 실제로 많이 쓰는 방식은 역할 분담이다. 챗봇 응대나 대량 분류처럼 빠른 응답이 중요하고 양이 많은 작업은 Haiku에게 맡겨 비용을 아끼고, 정말 어려운 판단만 Sonnet이나 Opus에게 넘긴다.

멀티 에이전트 구조에서는 이 장점이 더 두드러진다. 여러 개의 서브에이전트를 동시에 돌려 파일을 읽고 코드를 고치게 할 때, 각 일꾼을 Haiku로 채우면 같은 비용으로 훨씬 많은 작업을 병렬로 처리할 수 있다. Claude Code 사용자들 사이에서는 일상적인 코딩 작업 대부분을 Haiku로 처리하다가, 모델이 막히기 시작하면 Sonnet으로 갈아타는 식의 활용이 자리잡았다.

주의할 점

아무리 가까워졌다 해도 가장 똑똑한 모델은 아니다. 복잡한 설계 판단이나 까다로운 디버깅처럼 깊은 추론이 필요한 일에서는 여전히 Sonnet·Opus가 더 안정적이다. 빠르고 싸다는 장점을 살려 "적재적소"에 배치하는 게 핵심이다.

#Anthropic#Claude#소형 모델#코딩

← AI Wiki에서 더 보기

updated at 2026-06-08