모델

Phi-4

Phi-4 (Microsoft)

마이크로소프트가 만든 140억 파라미터급 소형 오픈 모델로, 작은 크기에도 수학·논리 같은 복잡한 추론을 잘하도록 합성 데이터로 훈련됐다.

작지만 똑똑한 모델을 만들겠다는 시도

보통 더 똑똑한 AI를 원하면 모델을 키운다. 파라미터를 수백억, 수천억 개로 늘리는 식이다. 마이크로소프트의 Phi 계열은 그 반대 방향으로 간다. 모델을 작게 유지하면서도 데이터의 질을 극단적으로 끌어올려 큰 모델 못지않은 실력을 내겠다는 것이다. Phi-4는 그 4세대 모델로, 140억(14B) 파라미터짜리 오픈 모델이다. 노트북이나 작은 서버 한 대에서도 돌릴 수 있을 만큼 가벼우면서, 특히 수학 문제나 논리적 추론에서 자기보다 훨씬 큰 모델들을 앞지르는 결과를 보여줬다.

이 성능의 비결은 훈련 데이터에 있다. 인터넷에서 긁어모은 잡다한 텍스트 대신, AI가 직접 만들어낸 고품질 합성 데이터(synthetic data)와 엄선한 교과서·문제풀이 자료를 골라 학습시켰다. 사람으로 치면 아무 책이나 잔뜩 읽히는 대신 잘 정리된 문제집으로 공부시킨 셈이다.

개발자가 언제 어떻게 쓰나

Phi-4는 오픈 모델이라 누구나 받아서 직접 돌릴 수 있다. 가장 쉬운 방법은 ollama run phi4처럼 로컬 실행 도구로 내 컴퓨터에 띄우는 것이다. 클라우드에 데이터를 보내지 않아도 되니 사내 문서나 민감한 데이터를 다룰 때 유용하다. Hugging Face에서 가중치를 받아 vLLM이나 SGLang 같은 서빙 엔진에 올리거나, 마이크로소프트의 Azure AI Foundry 카탈로그에서 API로 바로 호출할 수도 있다.

실제 활용은 "비용·속도가 중요한데 추론력도 필요한" 자리에 잘 맞는다. 예를 들어 대량의 문서를 분류하거나 수식이 섞인 질문에 답하는 작업을, 거대 모델에 매번 비싼 API 요청을 보내는 대신 Phi-4 한 대로 저렴하게 처리하는 식이다.

가족이 늘어난 Phi-4

Phi-4는 한 모델로 끝나지 않고 용도별로 갈라졌다. Phi-4-mini는 38억 파라미터로 더 작아진 대신 함수 호출(도구 사용)을 지원해 에이전트의 부품으로 쓰기 좋고, Phi-4-multimodal은 텍스트뿐 아니라 이미지와 음성까지 한 모델에서 동시에 처리하는 56억 파라미터 모델이다. 이후 추론에 특화한 Phi-4-reasoning 갈래도 나오면서, "작은 크기로 어디까지 되나"를 계속 실험하는 라인업이 됐다.

주의할 점

작은 모델인 만큼 한계도 분명하다. 폭넓은 세상 지식이나 길고 복잡한 대화에서는 GPT나 Gemini 같은 대형 모델만큼 안정적이지 않고, 잘못된 답을 자신 있게 내놓는 환각도 여전하다. 마이크로소프트도 고위험 분야에 쓰기 전에는 정확도와 안전성을 별도로 검증하라고 권한다.

#Microsoft#Phi 계열#소형 언어 모델#추론

← AI Wiki에서 더 보기

updated at 2026-06-08