# Hard to See, Hard to Label: Generative and Symbolic Acquisition for Subtle Visual Phenomena

### 저자

Renjith Prasad, Rishabh Sharma, Andrew E. Shao, Annmary Justine Koomthanam, Shreyas Kulkarni, Suparna Bhattacharya, Martin Foltin, Amit Sheth, David Orozco, Matthew Quinn, Brian Sammuli

### 💡 개요

머리카락 굵기의 균열, 밀리미터 이하의 공극, 저대비 포함물과 같은 미묘한 시각적 이상 현상은 시각적으로 모호하여 레이블링이 어렵고 능동 학습 시 간과되기 쉽습니다. 본 논문은 이러한 미묘한 이상 현상을 효과적으로 탐지하기 위해 확산 모델 기반의 난이도 신호와 계층적 의미론적 커버리지 우선순위를 결합한 능동 학습 프레임워크인 GSAL을 제안합니다. GSAL은 시각적 난이도와 의미론적 커버리지를 균형 있게 고려하여, 불확실성 기반 방법론이 놓치기 쉬운 미묘하고 희귀한 표적의 검색을 개선합니다.

### 🔑 시사점 및 한계

- 능동 학습에서 미묘하고 시각적으로 모호한 객체를 효율적으로 탐지하는 새로운 프레임워크를 제시합니다.

- 확산 모델의 시각적 난이도 측정과 계층적 의미론적 커버리지 우선순위를 결합하여 기존 방법론의 한계를 극복합니다.

- 산업 현장의 결함 검사와 같이 희귀하고 탐지하기 어려운 객체가 중요한 애플리케이션에서 레이블 효율성과 희귀 클래스 검색 성능을 향상시킵니다.

- 제안된 확산 기반 난이도 신호가 단독으로는 지배적인 의미론적 모드 내의 어려운 샘플을 반복적으로 선호할 수 있으며, 이를 해결하기 위해 의미론적 커버리지 구성 요소를 추가한 만큼, 각 구성 요소의 최적 균형점 탐색이 추가적인 연구 과제가 될 수 있습니다.

---

[PDF 보기](https://arxiv.org/pdf/2604.22990)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).