구글이 만든 가벼우면서도 똑똑한 멀티모달 모델로, Flash 특유의 빠른 속도를 유지하면서 코딩과 에이전트 작업에서 큰 플래그십 모델에 가까운 성능을 낸다.
Gemini 3.5 Flash는 구글이 2026년 5월 I/O에서 공개한 Gemini 3.5 제품군의 첫 모델이다. 구글의 Gemini 라인업은 무거운 Pro와 가벼운 Flash로 나뉘는데, Flash는 원래 "빠르고 저렴한" 보급형 자리였다. 3.5 Flash는 그 속도를 유지하면서도 지능을 크게 끌어올려, 이전 세대 Pro에 가까운 수준의 코딩·추론 능력을 Flash 가격대에서 제공하는 것이 핵심이다. 텍스트뿐 아니라 이미지, 영상, 오디오, PDF까지 한 번에 입력으로 받는 멀티모달 모델이며, 100만 토큰의 긴 컨텍스트 윈도우를 지원한다.
가장 큰 차별점은 에이전트형 실행(agentic execution)에 맞춰 설계됐다는 점이다. 단순히 한 번 묻고 한 번 답하는 게 아니라, 도구를 여러 번 호출하며 길게 이어지는 작업을 안정적으로 처리하도록 다듬어졌다. 또 생각의 깊이(thinking level)를 minimal/low/medium/high로 조절할 수 있어, 빠른 응답이 필요하면 얕게 생각하게 하고 어려운 문제는 깊게 추론하도록 비용과 성능을 직접 조율한다. 이전 프리뷰 모델의 기본값이 high였던 것과 달리 3.5 Flash는 기본이 medium으로 바뀌어, 평소에는 더 빠르고 저렴하게 동작한다.
API에서는 모델 이름으로 gemini-3.5-flash를 지정하면 된다. 구글 AI 스튜디오와 Gemini API, 안드로이드 스튜디오, 그리고 구글의 에이전트 개발 환경인 Antigravity를 통해 바로 호출할 수 있다. 특히 코딩 에이전트를 만들 때, 파일을 읽고 코드를 고치고 테스트를 돌리는 식의 반복 루프를 Flash 비용으로 돌릴 수 있어 부담이 적다. 출력 토큰도 최대 65,000개까지 받을 수 있어 긴 코드 생성이나 문서 작업에 유리하다.
지능이 올라간 만큼 가격도 함께 올랐다. 이전 Flash 프리뷰보다 약 3배 비싸져서, "가장 싼 옵션"이라는 Flash의 정체성이 흐려졌다는 평가가 있다. 실제로 일부 개발자는 "체감 속도가 기대만큼 빠르지 않고, 어려운 작업은 차라리 Pro가 낫다"는 후기를 남기기도 했다. 빠른 처리량과 비용이 중요한 대규모 에이전트 작업에는 잘 맞지만, 최고 난도의 추론이 필요하면 상위 모델과 비교해보는 게 좋다.