본 논문은 데이터가 부족한 특정 도메인의 데이터베이스에서 합성 표 형식 데이터 생성을 위한 새로운 프레임워크인 ReFine을 제안합니다. 기존의 GAN, 확산 모델, 미세 조정된 LLM들은 충분한 참조 데이터를 필요로 하지만, ReFine은 해석 가능한 모델에서 추출한 "if-then" 규칙을 프롬프트에 포함하여 도메인 특정 특징 분포를 명시적으로 안내합니다. 또한, 이중 입자 필터링 전략을 통해 과다 샘플링 패턴을 억제하고 드물지만 유익한 샘플을 선택적으로 개선하여 분포 불균형을 줄입니다. 다양한 회귀 및 분류 벤치마크에 대한 실험 결과, ReFine은 최첨단 방법들을 능가하여 회귀에서는 R-squared가 최대 0.44 향상, 분류에서는 F1 점수가 최대 10.0% 향상되는 결과를 보였습니다.