PolygoNet: Leveraging Simplified Polygonal Representation for Effective Image Classification
Created by
Haebom
저자
Salim Khazem, Jeremy Fix, Cedric Pradalier
개요
본 논문은 이미지의 다각형 표현을 활용하여 심층 학습 모델의 계산 복잡도와 과적합 문제를 해결하는 효율적인 방법을 제안합니다. 주요 점 또는 윤곽 좌표를 사용하여 입력 이미지를 압축된 다각형 형태로 변환함으로써, 계산 요구량을 크게 줄이고 훈련 속도를 높이며 자원을 절약하여 실시간 및 자원 제약 애플리케이션에 적합하도록 합니다. 이러한 표현은 본질적으로 중요한 이미지 특징을 포착하면서 노이즈를 필터링하여 과적합을 완화하는 자연스러운 정규화 효과를 제공합니다. 결과적으로 경량화된 모델은 전체 해상도 이미지를 사용하는 최첨단 방법과 비교할 만한 성능을 달성하면서 에지 장치 배포를 가능하게 합니다. 벤치마크 데이터 세트에 대한 광범위한 실험은 복잡성 감소, 일반화 개선 및 에지 컴퓨팅 애플리케이션 용이성에서 본 방법의 효과를 검증합니다. 이 연구는 실제 시나리오에 대한 효율적이고 확장 가능한 심층 학습 솔루션을 발전시키는 데 있어 다각형 표현의 잠재력을 보여줍니다. 코드는 https://github.com/salimkhazem/PolygoNet 에서 제공됩니다.