본 논문은 음파 탐지 이미지를 이용한 수중 물체 탐지 성능 향상을 위해, 신경망 구조 탐색(NAS) 기법을 적용한 Detection Transformer(DETR) 구조인 NAS-DETR을 제안합니다. 최대 엔트로피 원리를 기반으로 개선된 제로샷 NAS 방법을 통해 실시간 처리가 가능하고 표현 능력이 뛰어난 CNN-Transformer 백본을 찾아냅니다. 이 백본은 Feature Pyramid Network(FPN)와 변형 가능한 어텐션 기반 Transformer 디코더와 결합되어 완전한 네트워크 구조를 형성합니다. 두 개의 대표적인 데이터셋에서 최첨단 성능을 달성하며, 실시간 효율성과 계산 복잡도 측면에서도 최소한의 오버헤드만을 유지한다는 것을 실험을 통해 보여줍니다. 또한, 주요 매개변수와 차등 엔트로피 기반 적합도 함수 간의 상관 분석을 수행하여 제안된 프레임워크의 해석력을 높입니다. 본 연구는 음파 탐지 분야에서 DETR 구조와 NAS 탐색 메커니즘을 통합한 최초의 연구입니다.