Sign In

Pretraining Objective Matters in Extreme Low-Data FGVC: A Backbone-Controlled Study

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Alexander Hackett, Srikanth Thudumu, Ginny Fisher, Jason Fisher

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” κ·Ήλ„λ‘œ 적은 λ°μ΄ν„°λ‘œ λ―Έμ„Έ λΆ„λ₯˜(FGVC)λ₯Ό μˆ˜ν–‰ν•  λ•Œ 사전 ν•™μŠ΅ λͺ©μ μ΄ 후속 μž‘μ—…μ˜ ν‘œν˜„ ν’ˆμ§ˆμ— λ―ΈμΉ˜λŠ” 영ν–₯을 λΆ„μ„ν•©λ‹ˆλ‹€. λ™μΌν•œ ViT-B/16 백본을 μ‚¬μš©ν•˜κ³  지도 ν•™μŠ΅, λŒ€μ‘° ν•™μŠ΅(SigLIP2), 마슀크 볡원(MAE), 자기 증λ₯˜(DINOv3)둜 사전 ν•™μŠ΅λœ λ„€ κ°€μ§€ 인코더λ₯Ό 비ꡐ ν‰κ°€ν–ˆμŠ΅λ‹ˆλ‹€. 극저데이터 ν™˜κ²½μ—μ„œ 톡계적 λ…Έμ΄μ¦ˆλ₯Ό μ œμ–΄ν•˜κΈ° μœ„ν•΄ μˆœμ—΄ 검정을 μ‚¬μš©ν•œ κ²°κ³Ό, 지도 ν•™μŠ΅κ³Ό λŒ€μ‘° ν•™μŠ΅μ΄ μ„ ν˜• 뢄리 λŠ₯λ ₯이 κ°€μž₯ μš°μˆ˜ν–ˆμœΌλ©°, MAEλŠ” λΉ„μ„ ν˜• ν”„λ‘œλΈŒμ—μ„œ μ„±λŠ₯이 ν–₯μƒλ˜μ—ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
극저데이터 ν™˜κ²½μ—μ„œ μ„ ν˜• λΆ„λ₯˜κΈ°λ§Œ μ‚¬μš© κ°€λŠ₯ν•œ 경우, λ§ˆμ§„μ„ κ°•μ‘°ν•˜λŠ” 사전 ν•™μŠ΅ λͺ©μ (지도 ν•™μŠ΅, λŒ€μ‘° ν•™μŠ΅)이 νš¨κ³Όμ μž…λ‹ˆλ‹€.
β€’
λΉ„μ„ ν˜• λΆ„λ₯˜κΈ°λ₯Ό μ‚¬μš©ν•  수 μžˆλ‹€λ©΄, 마슀크 볡원 방식(MAE)이 더 λ‚˜μ€ μ„±λŠ₯을 보일 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ³Έ 연ꡬ κ²°κ³ΌλŠ” DINOv3κ°€ 이 νŠΉμ • λ„λ©”μΈμ—μ„œλŠ” λ‹€λ₯Έ 사전 ν•™μŠ΅ 방식에 λΉ„ν•΄ μ„±λŠ₯이 저쑰함을 μ‹œμ‚¬ν•©λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ μœ ν˜•μ˜ λ°±λ³Έκ³Ό 더 넓은 λ²”μœ„μ˜ 사전 ν•™μŠ΅ λͺ©μ μ— λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘