Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Automated data curation for self-supervised learning in underwater acoustic analysis

Created by
  • Haebom

저자

Hilde I Hummel, Sandjai Bhulai, Burooj Ghani, Rob van der Mei

개요

본 논문은 해양 생태계의 지속가능성을 위협하는 해양 소음 오염의 심각성을 고려하여, 대량의 수중 음향 기록 데이터 분석에 대한 자동화 필요성을 제기한다. 기존의 기계 학습 기법은 레이블링된 데이터에 의존하지만, 수중 음향 기록 데이터는 대부분 레이블이 없다는 한계를 지닌다. 따라서 본 논문에서는 미지의 수중 음향 데이터를 활용하여 자가 지도 학습 모델을 효과적으로 학습시키기 위한 전 자동화된 데이터 정제 파이프라인을 제안한다. 미국 해역의 다양한 수중 청음기로부터 수집된 원시 PAM 데이터와 AIS 데이터를 통합하여 계층적 k-means 군집화를 통해 균형 있고 다양한 데이터셋을 생성한다. 이렇게 생성된 데이터셋은 해양 포유류 모니터링 및 소음 오염 평가 등 다양한 작업에 활용 가능한 자가 지도 학습 모델 개발을 가능하게 한다.

시사점, 한계점

시사점:
대량의 비표지 수중 음향 데이터를 활용한 자가 지도 학습 모델 개발 가능성 제시
해양 소음 오염 모니터링 및 해양 생태계 보호를 위한 효율적인 데이터 처리 파이프라인 구축
AIS 데이터와 수중 음향 데이터 통합을 통한 데이터셋 다양성 및 균형 확보
해양 포유류 모니터링 및 소음 오염 평가 등 다양한 응용 분야에 기여
한계점:
제안된 파이프라인의 일반화 성능 및 다른 해역으로의 확장성에 대한 추가적인 검증 필요
계층적 k-means 군집화 외 다른 데이터 정제 기법과의 성능 비교 분석 필요
사용된 AIS 데이터의 정확성 및 신뢰도에 대한 고려 필요
자가 지도 학습 모델의 성능 및 한계에 대한 추가적인 분석 필요
👍