Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Edge Approximation Text Detector

Created by
  • Haebom

저자

Chuang Yang, Xu Han, Tao Han, Han Han, Bingxuan Zhao, Qi Wang

개요

본 논문에서는 효율적인 텍스트 형태 표현을 통해 장면 텍스트 검출 모델의 성능을 향상시키는 EdgeText를 제안합니다. 기존 방식의 부정확한 윤곽선이나 복잡한 파이프라인의 문제점을 해결하기 위해, 텍스트의 두 긴 변을 매끄러운 곡선으로 간주하고 매개변수 곡선 피팅 함수를 이용하여 윤곽선을 표현합니다. 텍스트 중심점을 먼저 찾고, 이를 기반으로 곡선 함수를 생성하여 텍스트 가장자리를 근사하며, 잘림점을 통해 곡선 세그먼트를 추출하여 윤곽선을 재구성합니다. 또한, 가장자리 특징 인식을 강화하는 양방향 향상 인식(BEP) 모듈과 곡선 분포에 집중하도록 하는 비례 적분 손실(PI-loss)을 도입하여 모델 학습을 효율화합니다.

시사점, 한계점

시사점:
텍스트 윤곽선을 효율적으로 표현하는 새로운 방법 제시
기존 방법의 복잡한 파이프라인 및 부정확한 윤곽선 문제 해결
매개변수 곡선 피팅 함수와 BEP 모듈, PI-loss를 통해 성능 향상
컴팩트하고 효율적인 텍스트 검출 파이프라인 구축 가능성 제시
한계점:
제안된 방법의 성능이 다양한 텍스트 형태 및 복잡한 배경에서 얼마나 일반화될 수 있는지 추가적인 실험이 필요
곡선 피팅 함수의 매개변수 설정에 대한 민감도 분석 필요
BEP 모듈과 PI-loss의 효과에 대한 정량적 분석 강화 필요
실제 응용 환경에서의 효율성 및 실시간 처리 가능성 검증 필요
👍