본 논문은 항공 원격 센싱(ARS) 영상의 특징적인 기울어진 시점으로 인해 어려움을 겪는 ARS 비전 작업을 위한 기초 모델인 RingMo-Aerial을 제안합니다. 주파수 강화 다중 헤드 자기 주의(FE-MSA) 메커니즘과 어파인 변환 기반 대조 학습 전훈련 방법을 도입하여 작은 표적에 대한 탐지 능력을 향상시키고 기울어진 시점에 최적화했습니다. 또한, 다양한 ARS 비전 작업에 대한 적응성과 효율성을 높이기 위해 효율적인 매개변수 미세 조정 방법인 ARS-Adapter를 제안합니다. 실험 결과, RingMo-Aerial은 여러 하위 작업에서 최첨단 성능을 달성하여 ARS 비전 작업의 성능 향상에 대한 실용성과 효과를 보여줍니다.
시사점, 한계점
•
시사점:
◦
ARS 비전 작업을 위한 새로운 기초 모델 RingMo-Aerial 제안
◦
FE-MSA 메커니즘과 어파인 변환 기반 대조 학습을 통해 작은 표적 탐지 성능 향상 및 기울어진 시점에 대한 최적화 달성
◦
효율적인 미세 조정 방법 ARS-Adapter를 통해 다양한 ARS 비전 작업에 대한 적응성 향상