중국 Zhipu AI(Z.ai)가 MIT 라이선스로 공개하는 오픈소스 대규모 언어 모델 계열로, 코딩과 에이전트 작업에서 최상위 폐쇄형 모델에 근접한 성능을 무료로 자체 호스팅할 수 있게 해준다.
GLM(General Language Model)은 중국 스타트업 Zhipu AI가 만든 대규모 언어 모델 계열이다. 회사는 2025년 해외용 브랜드를 Z.ai로 바꿨고, 모델 가중치를 MIT 라이선스로 통째로 풀어버린 게 특징이다. 보통 GPT나 Claude 같은 최상급 모델은 회사 서버를 통해서만 쓸 수 있는데, GLM은 모델 파일 자체를 받아 내 컴퓨터나 회사 서버에 올려 돌릴 수 있다. 그러면서도 성능은 상위권이라, "DeepSeek 모먼트"처럼 비싼 폐쇄형 모델만 좋다는 통념을 깨뜨린 사례로 자주 거론된다.
GLM-4.5, GLM-4.6, GLM-4.7을 거쳐 최신 GLM-5에 이르기까지, 특히 코딩과 에이전트 작업에 집중해 발전해 왔다. 수백억~수천억 개 파라미터를 가진 MoE(전문가 혼합) 구조라 덩치는 크지만, 한 번에 일부 전문가만 활성화해 추론 비용을 낮춘다.
가장 흔한 사용처는 저렴한 AI 코딩이다. GLM은 Claude API와 호환되도록 만들어져서, Claude Code의 ~/.claude/settings.json에서 모델 이름만 "GLM-5" 같은 값으로 바꾸면 기존 도구를 그대로 쓰면서 비용을 크게 줄일 수 있다. Z.ai의 코딩 구독 플랜이나 api.z.ai 엔드포인트를 붙여 OpenClaw, OpenCode 같은 에이전트 도구에 연결하는 식이다.
가중치가 공개돼 있으니 vLLM이나 SGLang으로 직접 서빙하거나, 양자화 버전을 받아 Ollama·LM Studio에서 로컬 구동하는 것도 가능하다. 데이터를 외부로 보내면 안 되는 환경이거나, 자체 코드베이스에 맞춰 파인튜닝하고 싶을 때 폐쇄형 API의 대안으로 고른다. 30B급 GLM-4.7-Flash처럼 가벼운 버전은 일반 PC에서도 돌릴 만한 가성비 옵션으로 쓰인다.
벤치마크 점수가 Claude Opus 같은 최상위 모델에 "근접"한 것이지 모든 작업에서 동등하지는 않다. 특히 영어권 미묘한 추론이나 최신 도구 연동에서는 차이가 날 수 있어, 실제 워크플로우에 넣기 전에 직접 테스트해 보는 게 좋다. 또한 GLM이라는 약어는 통계학의 일반화 선형 모형(Generalized Linear Model)을 가리키기도 하므로 검색 시 혼동에 유의한다.