Stable Diffusion 원개발자들이 만든 회사 Black Forest Labs의 텍스트-이미지 생성 모델. 글자가 또렷하게 박히는 고품질 이미지를 뽑고, 상당수 버전을 직접 내려받아 돌릴 수 있다.
FLUX는 독일 프라이부르크에 있는 Black Forest Labs(BFL)가 만든 텍스트-이미지 생성 모델이다. 이 회사를 세운 사람들은 원래 Stable Diffusion을 만들었던 사람들이다. 즉, 오픈소스 이미지 생성의 흐름을 만든 팀이 회사를 새로 차려 내놓은 후속작이라고 보면 된다. 2024년 8월 첫 모델이 공개됐고, 글로 프롬프트를 적으면 그에 맞는 그림을 그려준다.
구조적으로는 디퓨전과 트랜스포머를 섞은 방식을 쓰고, 첫 모델 기준 120억 개의 파라미터로 키웠다. 덕분에 프롬프트를 충실히 따르고, 디테일이 살아있고, 무엇보다 이미지 안에 글자를 또렷하게 써넣는 능력이 좋다 — 이건 기존 이미지 모델들이 오래 못했던 부분이다.
FLUX는 하나의 모델이 아니라 용도와 라이선스에 따라 여러 갈래로 나뉜다. 크게 보면 가장 강력하지만 API로만 쓰는 FLUX.1 [pro], 누구나 내려받아 비상업 용도로 쓸 수 있는 FLUX.1 [dev], 그리고 속도를 극단적으로 끌어올린 경량 버전이 있다. 2025년 5월에는 글과 이미지를 함께 입력해 "이 사진에서 배경만 바꿔줘" 같은 편집을 시키는 FLUX.1 Kontext가 나왔고, 2025년 11월에는 4MP 고해상도와 여러 장의 참조 이미지를 동시에 물려 일관된 변형을 뽑는 FLUX.2 계열(Pro/Flex/Dev, 그리고 Apache 2.0으로 완전 공개된 Klein)이 공개됐다.
개발자 입장에서 가장 흔한 사용법은 두 갈래다. 하나는 BFL이나 fal.ai, Replicate 같은 곳의 API를 호출해 서비스 안에서 이미지를 받아오는 방식이고, 다른 하나는 FLUX.1 [dev] 같은 오픈 웨이트 모델을 직접 내려받아 내 GPU에서 돌리는 방식이다. 후자의 경우 diffusers 파이썬 라이브러리로 FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev")처럼 불러오거나, ComfyUI 같은 노드 기반 툴에 모델 파일을 얹어 워크플로우를 짠다.
로컬에서 돌릴 때 VRAM이 부담이라 FP8로 양자화한 버전을 쓰거나, LoRA로 특정 화풍·인물을 가볍게 학습시켜 붙이는 식으로 많이 활용한다. 예를 들어 상업용 제품 사진을 일관된 스타일로 대량 생성하거나, Kontext로 기존 사진의 일부만 자연어로 고치는 식이다.
"오픈"이라는 말에 주의해야 한다. 완전히 자유로운 Apache 2.0 버전(Klein, VAE)도 있지만, 가장 많이 쓰이는 FLUX.1 [dev]는 비상업 라이선스라서 상업적으로 쓰려면 별도 라이선스가 필요하다. 또 같은 FLUX라도 pro/dev/klein이 품질과 속도가 다르니, 만들려는 결과물과 가진 GPU에 맞춰 버전을 골라야 한다.