# Relational In-Context Learning via Synthetic Pre-training with Structural Prior

### 저자

Yanbo Wang, Jiaxuan You, Chuan Shi, Muhan Zhang

### 💡 개요

본 연구는 텍스트 및 비전 분야와 달리 부족하고 사적인 특성을 가진 관계형 데이터베이스(RDB)를 위한 최초의 관계형 기반 모델인 RDB-PFN을 제안합니다. 데이터 부족 문제를 해결하기 위해 구조적 인과 모델(SCM)에서 생성된 합성 데이터를 활용한 구조적 사전 생성기를 통해 RDB-PFN은 2백만 개 이상의 합성 데이터를 이용하여 사전 학습되었습니다. 이를 통해 RDB-PFN은 다양한 RDB 작업에 대해 즉각적으로 적응하며, 실제 19개 관계형 예측 작업에서 그래프 기반 및 단일 테이블 기반 모델보다 뛰어난 성능을 보여줍니다.

### 🔑 시사점 및 한계

- **관계형 데이터베이스를 위한 최초의 합성 데이터 기반 사전 학습 모델 제시:** 희소하고 사적인 RDB 데이터의 한계를 극복하고 범용적인 RDB 이해 및 예측 모델 개발 가능성을 열었습니다.

- **인컨텍스트 학습을 통한 빠른 적응력:** 사전 학습된 모델이 새로운 데이터베이스에 대해 별도의 fine-tuning 없이도 즉각적으로 성능을 발휘할 수 있음을 입증했습니다.

- **경량 아키텍처 및 빠른 추론:** 효율적인 모델 구조를 통해 실제 서비스 적용 가능성을 높였습니다.

- **합성 데이터 생성의 품질 및 다양성:** 생성된 합성 데이터가 실제 RDB의 복잡성과 다양성을 얼마나 잘 반영하는지에 대한 추가적인 검증이 필요할 수 있습니다.

[PDF 보기](https://arxiv.org/pdf/2603.03805)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
