AI가 군더더기 없이 원시인처럼 짧게 말하게 만들어 출력 토큰을 크게 줄이는 Claude Code 스킬.
AI 코딩 도구를 쓰다 보면 모델이 "이 React 컴포넌트가 다시 렌더링되는 이유는 아마도 렌더링마다 새 객체 참조를 만들고 있기 때문일 가능성이 높습니다. useMemo로 메모이제이션하는 것을 권장드립니다" 같은 식으로 정중하고 길게 답한다. 정보는 한두 마디면 충분한데, 관사·완충 표현·예의상 붙는 말이 토큰을 잡아먹는다. 사용량 한도가 있는 요금제에서는 이 군더더기 때문에 대화가 일찍 끊긴다. Caveman은 이 문제를 정공법으로 해결한다. 모델에게 "원시인처럼 말하라"고 지시해서, 위 답을 "New object ref each render. useMemo fix."처럼 핵심만 남긴 짧은 문장으로 바꾼다. 만든 사람의 표현대로 why use many token when whole agent save — 출력 토큰을 대략 75%까지 줄이면서 기술적 정확도는 그대로 유지하는 게 목표다.
Claude Code에 스킬로 설치한 뒤 /caveman으로 켜고 끈다. 한 번 켜면 명시적으로 끌 때까지 계속 압축 모드로 동작하기 때문에, 토큰을 빠르게 소모하는 긴 디버깅 세션에서 켜두면 효과가 크다. 압축 강도도 골라 쓸 수 있는데, lite는 문장을 온전히 유지하면서 군더더기만 덜어내고, full은 전형적인 원시인 말투로 문장을 조각내며, ultra는 화살표와 단어 수준까지 줄인다. Claude Code뿐 아니라 Codex, Cursor, Gemini 등 30여 개 AI 코딩 에이전트에 같은 방식으로 붙는다.
출력만 줄이는 게 아니라 입력 쪽도 손대는 갈래가 있다. /caveman:compress는 CLAUDE.md나 메모리 파일을 원시인 말투로 압축해 파일 자체를 덮어쓰고, 읽기 좋은 원본은 FILE.original.md로 백업한다. 코드 블록·URL·기술 용어는 그대로 두고 관사와 장황한 표현만 걷어내기 때문에, 매 세션마다 읽어 들이는 시스템 컨텍스트가 줄어 미래의 모든 대화에서 토큰이 절약된다. 실제 코드 파일은 건드리지 않고 자연어 파일에만 적용된다.
Caveman이 걷어내는 75%가 전부 낭비는 아니다. 부드러운 설명과 맥락이 사라지면서 답이 모호해질 수 있어, 보안 경고나 파일 삭제처럼 되돌릴 수 없는 작업에서는 원시인 말투를 자동으로 잠시 끄는 안전장치를 둔다. "그냥 간결하게 답해"라는 평범한 지시만으로도 비슷한 토큰 절감이 나온다는 비교도 있어, 압축률 자체보다 어떤 작업에서 켤지 가려 쓰는 판단이 더 중요하다.