다중 소스 전이 학습은 여러 소스 작업을 활용하여 실제 감독 학습 시나리오에서 데이터 부족 문제를 해결하는 효과적인 솔루션입니다. 본 논문은 각 소스 작업에서 대상 모델을 공동으로 학습하는 데 필요한 최적의 소스 샘플 양을 결정하기 위한 이론적 프레임워크를 제안합니다. K-L 발산 기반의 일반화 오류 측정을 도입하고, 고차원 통계 분석을 기반으로 이를 최소화하여 각 소스 작업에 대한 최적의 전이 양을 결정합니다. 또한, 아키텍처에 독립적이고 데이터 효율적인 알고리즘 OTQMS를 개발하여 다중 소스 전이 학습에서 대상 모델 학습을 위한 이론적 결과를 구현합니다.
시사점, 한계점
•
시사점:
◦
다중 소스 전이 학습에서 각 소스 작업으로부터 필요한 최적의 샘플 양을 이론적으로 결정하는 프레임워크 제시.