본 논문은 다중 모달리티 데이터를 활용하는 실세계 머신러닝 애플리케이션에서 모든 샘플에 모든 모달리티가 존재하지 않고 추가 모달리티 확보에 비용이 발생하는 상황을 고려하여, 제한된 자원 하에서 어떤 샘플에 추가 모달리티를 우선적으로 확보해야 하는지 탐구합니다. 기존 연구들이 개별 샘플 기반의 전략이나 학습 단계의 능동 학습에 초점을 맞춘 반면, 본 논문은 실세계 적용에 중요한 테스트 단계 및 코호트 기반의 모달리티 확보 문제를 다룹니다. 이를 위해 코호트 기반 능동 모달리티 확보(CAMA)라는 새로운 테스트 단계 설정을 제시하고, 생성적 imputation과 판별적 모델링을 결합하여 누락된 모달리티 확보의 예상 이점을 평가하는 전략을 제시합니다. 또한, 성능 상한선을 제공하는 휴리스틱을 도입하여 확보 전략을 벤치마킹합니다. 다양한 다중 모달리티 데이터셋 실험을 통해 제안된 imputation 기반 전략이 단일 모달리티 정보, 엔트로피 기반, 무작위 선택에 비해 새로운 샘플 확보를 더 효과적으로 안내함을 보여줍니다. 결론적으로, 제한된 환경에서 자원 활용을 개선하는 코호트 수준의 모달리티 확보 최적화에 대한 효과적인 해결책을 제공합니다.