모델

GLM 5.2

GLM 5.2 (Z.ai)

Z.ai(구 Zhipu AI)가 개발한 오픈 웨이트 에이전틱 코딩 모델로, 744B 파라미터 MoE 구조와 1M 토큰 컨텍스트를 갖추고 장기 소프트웨어 엔지니어링 과제를 자율적으로 처리한다.

개념 설명

GLM 5.2는 중국 칭화대학교 출신의 Z.ai(구 Zhipu AI)가 개발한 744B 파라미터 MoE(Mixture of Experts) 기반 오픈 웨이트 에이전틱 AI 모델이다. '질문에 답하는' AI가 아니라 장기적인 소프트웨어 엔지니어링 과제를 최소한의 인간 개입으로 자율 완수하도록 설계됐다. 실제 활성 파라미터는 토큰당 약 40B 수준이며, MIT 라이선스로 공개되어 가중치를 자유롭게 내려받아 파인튜닝하거나 자체 서버에 배포할 수 있다.

가장 주목할 특징은 1M 토큰 컨텍스트다. 전작 GLM-5.1이 200K였던 것을 5배 늘렸으며, 이를 위해 DSA(Deep Sparse Attention)의 인덱서 계산 비용을 줄이는 IndexShare 기법을 적용했다. FrontierSWE, PostTrainBench, SWE-Marathon 등 에이전틱 코딩 벤치마크에서 GPT-5.5를 상회하고 Opus 4.8에 근접하는 성능을 보였다.

사용 예시

가장 빠른 시작은 Cloudflare Workers AI의 @cf/zai-org/glm-5.2 엔드포인트를 통해 API로 호출하는 것이다. Claude Code에서도 기본 모델을 GLM 5.2로 전환해 사용할 수 있는데, Z.ai 공식 문서에서 설정 방법을 안내한다. Together AI, Hugging Face Inference, vLLM(v0.23.0+)으로도 로컬 배포가 가능하다.

Z.ai는 GLM 5.2에 최적화된 자체 CLI 코딩 에이전트인 Z Code도 제공한다. 하루 5M 토큰의 무료 할당량을 지원하며, MCP 서버 연결, 플러그인, 프로젝트 생성, 브라우저 미리보기 등을 포함한다. Cline, OpenCode 등 기존 AI 코딩 도구와도 모델 스위칭으로 호환된다.

주의할 점

출시 시점 기준으로 비전(이미지 입력) 기능을 지원하지 않는다. 멀티모달 워크플로우에는 적합하지 않다. 총 744B 파라미터의 전체 모델을 로컬에서 실행하려면 상당한 GPU 자원이 필요하기 때문에 대부분의 개발자에게는 API나 추론 서비스를 통한 활용이 현실적이다.

#오픈 웨이트#MoE#에이전틱 코딩
← AI Wiki에서 더 보기
updated at 2026-06-21