Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Real-Time Emergency Vehicle Siren Detection with Efficient CNNs on Embedded Hardware

Created by
  • Haebom

저자

Marco Giordano, Stefano Giacomelli, Claudia Rinaldi, Fabio Graziosi

개요

본 논문은 임베디드 하드웨어에서 실시간 배포를 위해 설계된, 풀스택 응급 차량(EV) 사이렌 탐지 시스템을 제시합니다. 제안된 접근 방식은 도시 음향 환경에서 이진 사운드 이벤트 탐지를 위해 최적화된 EPANNs에서 파생된 미세 조정된 합성곱 신경망인 E2PANNs를 기반으로 합니다. 핵심 기여는 표준 AudioSet 주석의 낮은 신뢰성을 극복하기 위해 사용자 지정 AudioSet-Tools 프레임워크를 사용하여 개발된 정리되고 의미적으로 구조화된 데이터 세트인 AudioSet-EV, AudioSet-EV Augmented 및 Unified-EV를 만든 것입니다. 이 시스템은 고충실도 DAC+마이크 보드가 장착된 Raspberry Pi 5에 배포되어 적응형 프레임 크기 조정, 확률 평활화 및 오탐 활성화를 제어하는 의사결정 상태 머신을 갖춘 다중 스레드 추론 엔진을 구현합니다. 원격 WebSocket 인터페이스는 실시간 모니터링을 제공하고 라이브 데모 기능을 용이하게 합니다. 성능은 여러 구성에 걸쳐 프레임 단위 및 이벤트 기반 메트릭을 사용하여 평가됩니다. 결과는 시스템이 실제 음향 조건에서 향상된 강력함으로 낮은 대기 시간 탐지를 달성함을 보여줍니다. 이 연구는 저렴한 에지 장치에서 WebSocket 연결을 통해 스마트 시티 인프라 전반에 걸친 응급 차량 추적을 가능하게 하는 분산형 음향 모니터링 네트워크를 형성할 수 있는 IoS 호환 SED 솔루션의 배포 가능성을 보여줍니다.

시사점, 한계점

시사점:
저렴한 임베디드 하드웨어(Raspberry Pi 5)에서 실시간 응급 차량 사이렌 탐지 시스템 구현의 실현 가능성을 입증.
도시 환경의 복잡한 음향 조건에서도 높은 정확도와 낮은 지연 시간을 달성.
AudioSet-Tools 프레임워크를 이용한 고품질 데이터셋 구축 방법 제시.
WebSocket 기반 분산형 음향 모니터링 네트워크 구축 가능성 제시.
다양한 성능 평가 지표(프레임 단위 및 이벤트 기반) 활용.
한계점:
데이터셋의 크기 및 다양성에 대한 명시적인 언급 부족. 더욱 다양한 환경과 사이렌 종류에 대한 데이터 확보 필요성.
실제 현장 배포 및 장기간 운용에 대한 성능 평가 부족.
오탐 감소를 위한 추가적인 알고리즘 개선 필요성.
다른 유형의 소음과의 구분에 대한 자세한 분석 부족.
시스템의 에너지 효율성에 대한 평가 부족.
👍