모델

제미나이 3 프로

Gemini 3 Pro (Google)

구글이 만든 Gemini 계열의 최상위 추론 모델로, 텍스트뿐 아니라 이미지·오디오·동영상·PDF·코드까지 한꺼번에 이해하고 100만 토큰의 긴 맥락을 다루는 데 쓴다.

어떤 모델인가

Gemini 3 Pro는 구글(딥마인드)이 2025년 11월에 프리뷰로 공개한 Gemini 3 세대의 대표 모델이다. 이전 세대인 Gemini 2.5 Pro가 한동안 평가 순위 상단을 지켰는데, 그걸 한 단계 더 끌어올린 버전이라고 보면 된다. 가장 큰 특징은 단순히 글을 잘 쓰는 모델이 아니라 깊게 생각하고(추론) 도구를 직접 다루는 데 초점이 맞춰져 있다는 점이다.

또 하나의 핵심은 입력의 폭이다. 텍스트와 코드는 물론 이미지, 오디오, 동영상, PDF까지 한 번에 넣을 수 있고, 컨텍스트 창이 100만 토큰이라 코드 저장소 전체나 긴 문서 묶음을 통째로 던져 넣고 질문할 수 있다. 그래서 "이 영상에서 무슨 일이 벌어지는지 설명해줘", "이 PDF 더미에서 핵심만 정리해줘" 같은 작업을 한 모델로 처리한다.

실제로 어떻게 쓰나

개발자 입장에서 가장 직접적인 통로는 gemini-3-pro-preview 모델 ID로 호출하는 Gemini API다. 구글 AI Studio에서 API 키를 받아 곧바로 코드에서 부르거나, 엔터프라이즈 환경이라면 Vertex AI를 통해 붙인다. 프로토타입은 AI Studio에서 만들고 그대로 Cloud Run에 배포하는 식으로 이어가기도 한다.

터미널에서 일하는 사람에게는 Gemini CLI 연동이 특히 유용하다. npm install -g @google/gemini-cli@latest로 최신 버전을 깔고 설정에서 프리뷰 기능을 켜면 CLI가 기본 모델로 Gemini 3 Pro를 쓴다. 이렇게 하면 복잡한 엔지니어링 작업을 모델이 명령을 실행하고 도구를 호출하며 단계적으로 풀어가는 에이전틱 코딩 방식으로 진행할 수 있다. 구글은 같은 시점에 에이전트 기반 개발 환경인 Antigravity도 함께 내놓아, 모델이 사람처럼 계획을 세우고 코드를 짜도록 묶었다.

차별점과 강점

커뮤니티에서 가장 많이 언급되는 강점은 바이브 코딩(vibe coding)이다. 자세한 사양 없이 "이런 앱을 만들어줘" 정도의 자연어 지시만으로도 계획부터 코드 생성까지 한 번에 처리하는 제로샷 생성 능력이 두드러진다. 수학·물리 추론과 시각 정보 이해도 강해서, 표·그래프·차트처럼 정보가 빽빽한 자료를 읽고 해석하는 데 적합하다.

주의할 점

출시 시점 기준으로 프리뷰 단계라 "있는 그대로" 제공되며 지원이 제한될 수 있고, 이후 gemini-3.1-pro-preview 같은 후속 버전으로 빠르게 이어졌다. 또 모든 입력을 다루긴 하지만 오디오를 세밀하게 분석하거나 이미지를 영역 단위로 분할하는 용도는 우선순위로 설계되지 않았으니, 그런 작업에는 다른 모델을 함께 쓰는 편이 낫다.

#Google#Gemini#멀티모달#추론 모델

← AI Wiki에서 더 보기

updated at 2026-06-08