응용

리리아

Lyria (Google)

구글 딥마인드가 만든 음악 생성 AI로, 텍스트나 이미지 한 장만 넣으면 보컬과 악기 편곡이 들어간 완성된 곡을 만들어 준다.

어떤 모델인가

Lyria는 구글 딥마인드가 만든 음악 생성 모델 계열이다. 이미지를 그리는 AI나 영상을 만드는 AI처럼, Lyria는 "오디오"를 만든다. 다만 단순히 소리만 내는 게 아니라 멜로디, 화성, 리듬, 그리고 보컬과 가사까지 갖춘 한 곡을 통째로 만들어 낸다는 점이 특징이다. "잔잔한 어쿠스틱 포크 느낌의 30초짜리 밝은 곡" 같은 문장 하나만 던지면, 노래 구조를 알아서 잡고 가사를 붙여 44.1kHz 스테레오 음원을 뽑아 준다. 사진을 넣으면 그 분위기에 맞는 곡을 만들어 주기도 한다.

핵심은 곡 구조를 "이해"한다는 점이다. 가장 최신인 Lyria 3는 도입부, 절(verse), 후렴(chorus), 브리지 같은 음악적 요소를 구분해서 다루기 때문에, 단조롭게 반복되는 배경음이 아니라 전개가 있는 진짜 곡을 만든다. 처음 공개됐던 2023년 버전에 비해 음질과 길이, 표현력이 크게 늘었고 이제는 한 곡이 최대 3분까지 자연스럽게 흘러간다.

두 갈래의 모델

Lyria는 쓰임새에 따라 갈래가 나뉜다. 완성된 곡을 만드는 쪽은 lyria-3-clip-preview(항상 30초 클립)와 lyria-3-pro-preview(절·후렴·브리지가 있는 몇 분짜리 전체 곡)로 나뉜다. 반면 Lyria RealTime은 결이 다르다. 한 번에 곡을 뽑는 게 아니라 멈추지 않는 음악 스트림을 계속 흘려보내면서, 듣는 도중에도 장르나 악기, 분위기를 실시간으로 바꿔 흐름을 비틀 수 있다. 구글의 MusicFX DJ가 이 RealTime 모델로 돌아간다.

개발자가 쓰는 법

가장 손쉬운 길은 Gemini 앱이다. 베타로 들어온 음악 생성 기능에서 텍스트나 사진을 넣으면 30초 트랙과 커버 아트가 함께 나온다. 코드로 다루고 싶다면 Gemini API에서 표준 generateContent 메서드로 Lyria 3를 호출하면 되고, 프롬프트만 바꿔 클립을 만들지 전체 곡을 만들지 정한다. 기업 환경에서는 Vertex AI(Gemini Enterprise Agent Platform)에서 lyria-002 같은 모델을 predict 메서드로 부른다. 실시간 연주가 필요하면 Google AI Studio에서 Lyria RealTime을 붙여 인터랙티브한 작곡 앱을 만들 수도 있다.

실제 활용은 영상·콘텐츠 제작 쪽에서 빠르게 자리잡고 있다. 영상 편집 도구 Google Vids 안에서 장면 분위기에 맞는 배경음악을 그 자리에서 만들어 깔거나, 무료 음원 사이트를 뒤지는 대신 필요한 느낌의 곡을 즉석에서 생성해 쓰는 식이다. Suno나 Udio 같은 전용 AI 작곡 서비스의 대안으로도 비교되곤 한다.

주의할 점

Lyria가 만든 모든 곡에는 SynthID라는 들리지 않는 워터마크가 박혀, 나중에 이 음원이 AI로 만들어졌는지 검증할 수 있다. 학습 데이터와 저작권 문제는 음악 생성 AI 전반의 민감한 지점이라, 구글은 자체 필터와 워터마크로 대비해 두었다고 밝히고 있다. 또 클립 모델의 길이가 30초로 고정돼 있는 등 모델별 제약이 있으니, 만들려는 결과물에 맞는 모델을 골라 써야 한다.

#Google DeepMind#음악 생성#Gemini#SynthID

← AI Wiki에서 더 보기

updated at 2026-06-08