본 논문은 제한된 쌍 데이터와 추가적인 비쌍 데이터를 모두 활용하는 반지도 학습 모델을 제안합니다. 기존의 조건부 분포 학습은 쌍 데이터에 의존하는 지도 학습 방식에 의존하지만, 쌍 데이터 획득의 어려움을 해결하기 위해 쌍 데이터와 주변 분포로부터 얻은 비쌍 데이터를 통합하는 새로운 학습 패러다임을 제시합니다. 데이터 우도 최대화 기법을 통해 쌍 및 비쌍 데이터를 원활하게 통합하고, 역 엔트로피 최적 수송(OT)과의 연관성을 밝힙니다. 이를 통해 계산적으로 효율적인 OT 알고리즘을 활용한 종단간 학습 알고리즘을 구축하고, 임의로 작은 오차로 참 조건부 분포를 복구할 수 있음을 보이는 보편적 근사 성질을 증명합니다. 실험 결과를 통해 제안된 방법이 쌍 및 비쌍 데이터를 동시에 효과적으로 활용하여 조건부 분포를 학습함을 보여줍니다.
시사점, 한계점
•
시사점:
◦
제한된 쌍 데이터와 풍부한 비쌍 데이터를 효과적으로 통합하여 조건부 분포 학습의 성능을 향상시킬 수 있는 새로운 학습 프레임워크 제시.
◦
역 엔트로피 최적 수송(OT)과의 연관성을 밝힘으로써 계산적으로 효율적인 최적 수송 알고리즘을 활용 가능하게 함.