Isai Daniel Chacon, Paola Ruiz Puentes, Jillian Pearse, Pablo Arbelaez
개요
본 논문은 자동화된 암석학적 분석을 위한 대규모 실험적 프레임워크인 LITHOS를 소개합니다. LITHOS는 편광된 빛의 211,604개 고해상도 RGB 패치와 25가지 광물 범주에 걸쳐 전문가가 주석을 단 105,802개의 입자로 구성되어 있습니다. 본 논문에서는 LITHOS에서 광물 분류를 위한 여러 딥러닝 기술을 평가하고, 편광 모달리티를 통합하는 듀얼 인코더 트랜스포머 아키텍처를 제안합니다.