모델

OLMo 3

OLMo 3 (AllenAI)

비영리 연구소 AllenAI(Ai2)가 만든 '완전 공개' 언어 모델 패밀리로, 가중치뿐 아니라 학습 데이터와 코드, 중간 체크포인트까지 전부 열어 누구나 처음부터 다시 만들 수 있게 한 7B·32B 모델이다.

누가, 무엇을 만들었나

OLMo 3는 미국 비영리 AI 연구소 AllenAI(Ai2, Allen Institute for AI)가 2025년 11월에 공개한 언어 모델 패밀리다. 이름은 Open Language Model의 약자로, 말 그대로 '열린 언어 모델'을 지향한다. 7B(70억 파라미터)와 32B(320억 파라미터) 두 크기로 나오고, 각 크기마다 용도가 다른 세 변형이 있다. 일반 텍스트 생성의 토대가 되는 Base, 대화·지시 수행에 맞춘 Instruct, 그리고 답을 내기 전에 단계적으로 생각하는 과정을 거치는 Think 변형이다.

핵심 차별점: '오픈 웨이트'를 넘어 '완전 공개'

요즘 'open' 모델이라고 하면 보통 가중치 파일만 받아쓸 수 있는 경우가 많은데, OLMo 3는 그보다 한참 더 나아간다. AllenAI는 가중치는 물론이고 모델을 만든 전체 과정(model flow)을 통째로 공개한다. 학습에 쓴 데이터 묶음인 Dolma 3, 학습·평가에 쓴 코드, 사전학습부터 미세조정까지의 중간 체크포인트가 전부 열려 있어서, 자원만 있으면 누구나 이 모델을 바닥부터 똑같이 재현해 만들 수 있다. 라이선스도 자유로운 Apache 2.0이다.

이게 중요한 이유는, 모델이 왜 그렇게 행동하는지를 데이터와 학습 레시피까지 들여다보며 연구할 수 있기 때문이다. 단순히 잘 쓰는 도구가 아니라, 언어 모델 자체를 과학적으로 연구하라고 만든 모델인 셈이다. 성능 면에서도 베껴 만든 수준이 아니라, 32B Base 모델은 같은 시기 Qwen 2.5와 비슷한 수준이고 Gemma 3 같은 모델을 앞선다고 평가된다.

개발자가 실제로 쓰는 법

로컬에서 직접 돌리고 싶으면 ollama run olmo-3:7b-instruct 한 줄이면 시작할 수 있다. 7B 모델은 6GB 정도 RAM이면 돌아가서 노트북에서도 부담이 적고, gguf·mlx 포맷으로도 배포돼 LM Studio 같은 데스크톱 앱에 그대로 올릴 수 있다. 추론 서버로 띄울 때는 vLLM이나 SGLang으로 서빙하고, 코드에서는 허깅페이스 Transformers의 AutoModelForCausalLM.from_pretrained("allenai/Olmo-3.1-32B-Instruct")로 불러온다. 도구 사용(tool use)과 멀티턴 대화를 지원하므로, 외부 API를 호출하는 에이전트의 두뇌로도 붙일 수 있다.

복잡한 수학·논리 문제처럼 생각하는 과정이 필요한 작업에는 Think 변형을, 일반 챗봇이나 빠른 응답에는 Instruct 변형을 고르면 된다. 출시 후에도 RL 학습을 이어가 Olmo 3.1 32B로 업데이트되며 수학·지시 따르기 성능이 더 올랐다.

주의할 점

완전 공개와 재현성이 최대 강점이지만, 코딩 같은 일부 영역의 벤치마크에서는 비슷한 크기의 Qwen 3 계열에 뒤처지는 부분이 있다. '최고 성능'보다는 '투명하게 열려 있으면서도 충분히 경쟁력 있는' 모델로 이해하는 편이 정확하다.

#AllenAI#오픈소스 LLM#추론 모델#Apache 2.0

← AI Wiki에서 더 보기

updated at 2026-06-08