본 논문은 고품질 데이터 학습이 인공지능 발전에 기여했지만, 데이터 주석 및 모델 훈련 비용이 큰 문제임을 지적하며, 제한된 데이터로 견고한 일반화를 달성하는 것을 목표로 한다. PAC 프레임워크 내에서 불가지론적 능동 샘플링 이론을 사용하여, 모델 독립적 지도 및 비지도 학습에서 저자원 데이터 학습과 관련된 일반화 오류 및 레이블 복잡성을 분석한다. 이를 바탕으로, 기울기 기반 최적화, 메타 반복 최적화, 기하학적 인식 최적화, LLM 기반 최적화 등 저자원 데이터 학습을 위한 다양한 최적화 전략을 조사한다. 또한, 도메인 전이, 강화 피드백, 계층적 구조 모델링 등 저자원 데이터의 이점을 활용할 수 있는 여러 학습 패러다임을 종합적으로 살펴본다. 마지막으로, 주요 발견 사항을 요약하고 저자원 데이터 학습에 대한 시사점을 제시한다.