AI 토큰 사용량을 생산성의 지표로 삼아 소비를 극대화하려는 행동 패턴. 빅테크 기업들이 사내 리더보드로 AI 활용을 독려하면서 생겨난 직장 문화 현상이다.
토큰맥싱은 'maxxing'(어떤 행동을 극단까지 최적화한다는 인터넷 슬랭)과 AI 토큰을 합친 말이다. AI 모델이 텍스트를 처리하는 최소 단위인 토큰을 얼마나 많이 소비하는지를 업무 성과의 지표로 보고, 사용량을 의도적으로 늘리는 행동을 가리킨다.
이 현상은 메타와 마이크로소프트 같은 빅테크에서 사내 AI 도입을 독려하기 위해 토큰 리더보드를 도입하면서 본격화됐다. 메타 내부에서는 'Session Immortal', 'Token Legend' 같은 칭호를 부여하며 직원들의 토큰 사용량을 순위로 매겼다. 일부 직원들은 리더보드를 의식하지 않더라도 "토큰을 너무 적게 쓰는 것처럼 보이고 싶지 않아서" 사용량을 늘렸다고 고백했다.
토큰 사용량은 측정하기 쉽고, 자동으로 집계되며, 팀 전체에 일관되게 적용할 수 있다. 경영진 입장에서는 AI 도입 현황을 한눈에 보여주는 매력적인 숫자처럼 보인다. 하지만 비판론자들은 이 지표가 실제 생산성과 거의 무관하다고 지적한다. 토큰을 많이 썼다는 것은 AI와 긴 대화를 나눴다는 뜻이지, 그 결과로 좋은 코드가 나왔거나 문제가 해결됐다는 보장이 없다.
더 심각한 문제는 역효과다. 관리자가 어떤 지표든 목표로 설정하면, 직원들은 그 지표를 높이는 방식으로 행동을 바꾼다. 실제로 Uber의 COO는 AI 예산을 4개월 만에 소진했다고 밝혔고, 한 AI 컨설턴트는 고객사가 Claude 라이선스에 사용 한도를 설정하지 않아 한 달에 5억 달러를 소비한 사례를 공유했다. "우리가 더 생산적이 된 건지, 아니면 그냥 토큰 태우는 데 돈을 쓴 건지" 구분이 안 된다는 지적이 이어지고 있다.
토큰맥싱에 대한 반성으로, 기술 조직에서는 valuemaxxing이라는 개념이 논의되기 시작했다. 토큰 소비량 자체보다, 수용된 출력물과 모델 비용, 리뷰 부담, 에이전트 행동 등 실제 가치와 연결된 지표를 추적하자는 방향이다. 엔지니어링 리더들은 토큰 사용량 대신 코드 병합 속도, 버그 해결률, 배포 빈도 같은 기존 개발 지표와 AI 사용을 연계해 판단하는 접근을 권한다.
토큰맥싱이라는 용어는 맥락에 따라 두 가지로 쓰인다. 부정적 의미로는 지표 조작 현상을 가리키지만, 중립적 의미로는 단순히 AI 도구를 적극적으로 활용하는 행동 자체를 뜻하기도 한다. 토큰 소비 자체가 문제가 아니라, 소비를 목적으로 삼는 것이 문제다. 토큰이 많이 드는 작업이라도 실제 생산성 향상으로 이어진다면 정당한 활용이다.