본 논문은 음향 이벤트 탐지(SED)를 위한 최첨단 자기 지도 학습(SSL) 모델들의 시너지 효과를 체계적으로 평가하고, 최적의 모델 선택 및 통합을 위한 가이드라인을 제시합니다. 다양한 SSL 표현(BEATs, HuBERT, WavLM 등)을 개별 SSL 임베딩 통합, 이중 모드 융합, 완전 집계의 세 가지 전략을 통해 결합하는 프레임워크를 제안합니다. DCASE 2023 Task 4 Challenge 실험 결과, 이중 모드 융합(예: CRNN+BEATs+WavLM)이 상호 보완적인 성능 향상을 달성하며, 개별 SSL 모델 중에서는 CRNN+BEATs가 최고의 결과를 보였습니다. 또한, 이벤트 경계 예측을 동적으로 조정하는 적응적 후처리 방법인 정규화된 음향 이벤트 경계 상자(nSEBBs)를 도입하여 독립형 SSL 모델의 PSDS1을 최대 4% 향상시켰습니다. 이러한 결과는 SSL 아키텍처의 호환성 및 상호 보완성을 강조하며, 작업별 융합 및 강력한 SED 시스템 설계에 대한 지침을 제공합니다.