LLM이 자신을 감싸는 실행 구조(스캐폴드)를 스스로 생성하고 최적화하는 방식. 사람이 직접 에이전트 하네스를 설계하는 대신, 모델이 자신에게 맞는 실행 코드를 직접 만들어낸다.
일반적인 LLM 에이전트는 사람이 미리 설계한 스캐폴드(프롬프트 흐름, 메모리, 도구 호출 로직 등의 외부 구조)를 전제로 동작한다. 반면 Self-Scaffolding LLM은 이 구조 자체를 모델이 스스로 작성한다. 즉, 어떤 도구를 언제 부르고, 어떤 순서로 작업을 이어갈지를 결정하는 코드를 모델이 직접 생성하고 실행하는 방식이다.
이 접근의 핵심 동기는 하네스 엔지니어링의 병목을 제거하는 것이다. 복잡한 에이전트 시스템을 만들려면 지금까지는 숙련된 개발자가 스캐폴드를 직접 짜야 했는데, Self-Scaffolding은 그 부담을 모델에게 넘긴다.
코딩 에이전트 분야에서 구체적인 시도가 나오고 있다. Ornith 1.0은 Self-Scaffolding LLM을 표방하며 설계된 에이전트 코딩 모델로, 주어진 작업에 맞게 자신의 실행 하네스를 생성하고 최적화한다. 개발자가 '이 레포를 리팩토링해줘'라고 요청하면, 모델이 파일 탐색 → 의존성 분석 → 수정 계획 수립 → 코드 실행이라는 실행 흐름을 직접 코드로 구성해서 돌리는 식이다.
Self-Harness 아키텍처라고도 불리는 이 패턴에서는 에이전트가 자신의 스캐폴딩 코드를 자동으로 생성하고, 결과를 평가한 뒤, 더 나은 방식으로 재작성하는 루프를 반복한다. 이는 code-as-harness 패턴과 자기개선(self-improving) 패턴이 결합된 형태로 볼 수 있다.
이 개념은 LLM의 스캐폴드 자체를 학습 대상으로 삼는 연구로도 확장된다. SIA(Self-Improving Agent) 계열 연구에서는 모델 가중치와 스캐폴딩 코드를 동시에 개선하는 방식을 탐구한다. 스캐폴드 코드가 고정된 기존 방식에 비해, 작업 유형에 따라 실행 구조가 달라질 수 있다는 점이 차별점이다.
Self-Scaffolding은 모델 자체의 능력에 크게 의존한다. 스캐폴드를 잘못 생성하면 작업 전체가 틀어질 수 있고, 생성된 코드를 안전하게 실행하려면 샌드박싱이 필수다. 또한 현재까지의 연구에서는 더 나은 스캐폴드보다 더 좋은 기반 모델이 성능에 더 큰 영향을 미친다는 분석도 있어, 스캐폴딩 자동화의 실질적 이득을 측정하는 것이 과제로 남아 있다.