모델

그래니트

IBM Granite

IBM이 기업용으로 만든 오픈소스 AI 모델 패밀리. 작고 효율적이면서도 라이선스가 깔끔해 회사가 마음 놓고 자체 서버에서 돌릴 수 있게 설계됐다.

기업이 안심하고 쓸 수 있는 모델을 목표로

회사가 AI를 도입할 때 가장 걱정하는 건 성능만이 아니다. "이 모델을 우리 데이터로 돌려도 라이선스 문제가 없나", "학습 데이터에 저작권 분쟁 소지는 없나", "외부 클라우드에 우리 기밀을 보내야만 하나" 같은 현실적인 고민이 따라온다. IBM Granite는 바로 이 지점을 노리고 만든 모델 패밀리다. 거대한 프론티어 모델과 성능을 다투기보다, 기업이 실제로 도입할 때 걸리는 걸림돌을 없애는 데 초점을 맞췄다.

그래서 Granite는 대부분 Apache 2.0 라이선스로 풀려 있어 상업적으로 자유롭게 쓰고 고칠 수 있고, 모델 크기도 350M부터 30B 정도까지로 비교적 작아서 회사 내부 서버나 심지어 노트북에서도 돌릴 수 있다. 외부에 데이터를 보내지 않아도 되니 민감한 정보를 다루는 금융·의료·공공 분야에서 특히 매력적이다.

실제로 어떻게 쓰는가

개발자 입장에서 Granite는 허깅페이스(ibm-granite)에서 가중치를 내려받아 Ollama나 vLLM 같은 도구로 로컬에서 띄우는 식으로 쓴다. 예를 들어 사내 코드베이스에 대한 질문에 답하는 어시스턴트를 만들 때, GPT나 Claude API로 코드를 외부에 보내기 곤란하다면 Granite를 회사 GPU에 올려놓고 RAG와 붙여 쓰는 선택지가 생긴다.

패밀리도 한 종류가 아니다. 일반 대화·도구 호출용 언어 모델 외에 116개 프로그래밍 언어로 학습한 코드 전용 모델, 문서의 표와 차트를 읽어내는 비전 모델, 음성 인식 모델, 검색용 임베딩 모델까지 갖춰져 있다. 덕분에 "PDF 보고서에서 표를 뽑아 요약"처럼 모달리티가 섞인 작업도 Granite 계열 안에서 조합할 수 있다.

작지만 효율을 노린 설계

최신 Granite 4.0/4.1 세대는 트랜스포머에 상태 공간 모델(Mamba) 구조를 섞은 하이브리드 아키텍처를 도입해, 긴 입력을 처리할 때 메모리를 덜 쓰면서도 속도를 낸다. 작은 모델이 훨씬 큰 모델과 도구 호출·지시 따르기 같은 실무 작업에서 견줄 만한 성능을 내는 게 핵심 셀링 포인트다. 함께 제공되는 Granite Guardian은 입출력에 유해하거나 위험한 내용이 없는지 걸러주는 가드레일 역할을 한다.

주의할 점

Granite는 "가장 똑똑한 모델"을 지향하지 않는다. 복잡한 추론이나 창의적 생성에서 최상위 프론티어 모델만큼을 기대하면 실망할 수 있다. 강점은 어디까지나 비용·라이선스·온프레미스 운영의 편의성에 있으므로, 범용 최고 성능이 필요한 작업과 안심하고 자체 운영할 모델이 필요한 작업을 구분해 선택하는 게 좋다.

#IBM#오픈소스#엔터프라이즈#SLM

← AI Wiki에서 더 보기

updated at 2026-06-08