Sign In

Relational Visual Similarity

Created by
  • Haebom
Category
Empty

μ €μž

Thao Nguyen, Sicheng Mo, Krishna Kumar Singh, Yilin Wang, Jing Shi, Nicholas Kolkin, Eli Shechtman, Yong Jae Lee, Yuheng Li

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” κΈ°μ‘΄ μ‹œκ°μ  μœ μ‚¬μ„± 척도가 ν‘œλ©΄μ  μ†μ„±μ—λ§Œ μ§‘μ€‘ν•˜μ—¬ 인간이 μΈμ§€ν•˜λŠ” ν’λΆ€ν•œ 관계적 μœ μ‚¬μ„±μ„ λ†“μΉœλ‹€λŠ” 문제λ₯Ό μ œκΈ°ν•©λ‹ˆλ‹€. 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, λ³Έ 논문은 λ‚΄λΆ€ κ΄€κ³„λ‚˜ κΈ°λŠ₯이 μœ μ‚¬ν•œ 이미지듀을 κ΄€κ³„μ μœΌλ‘œ μœ μ‚¬ν•˜λ‹€κ³  μ •μ˜ν•˜κ³ , 이λ₯Ό μΈ‘μ •ν•˜κΈ° μœ„ν•œ 114k 규λͺ¨μ˜ 이미지-μΊ‘μ…˜ 데이터셋을 κ΅¬μΆ•ν–ˆμŠ΅λ‹ˆλ‹€. 이 데이터셋을 ν™œμš©ν•˜μ—¬ Vision-Language λͺ¨λΈμ„ νŒŒμΈνŠœλ‹ν•¨μœΌλ‘œμ¨, μ‹œκ°μ  μ™Έν˜•μ΄ μ•„λ‹Œ λ‚΄μž¬λœ 관계 ꡬ쑰λ₯Ό 기반으둜 이미지λ₯Ό μ—°κ²°ν•˜λŠ” 방법을 μ œμ•ˆν•˜κ³ , μ΄λŠ” μ‹œκ° μ»΄ν“¨νŒ… λΆ„μ•Όμ˜ μ€‘μš”ν•œ 간극을 λ©”μš°λŠ” μ²«κ±ΈμŒμž…λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
인간이 μΈμ§€ν•˜λŠ” λ³΅μž‘ν•˜κ³  예츑 λΆˆκ°€λŠ₯ν•œ 관계적 μœ μ‚¬μ„±μ„ μ •λŸ‰ν™”ν•˜κ³  λͺ¨λΈλ§ν•  수 μžˆλŠ” μƒˆλ‘œμš΄ κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
κΈ°μ‘΄ 이미지 μœ μ‚¬μ„± λͺ¨λΈλ“€μ΄ ν‘œλ©΄μ  μ‹œκ° 정보에 μΉ˜μ€‘ν•˜κ³  μžˆμŒμ„ λͺ…ν™•νžˆ μ§€μ ν•˜λ©°, λͺ¨λΈ κ°œμ„ μ˜ λ°©ν–₯을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
114k 규λͺ¨μ˜ 읡λͺ…ν™”λœ μΊ‘μ…˜ 데이터셋은 ν–₯ν›„ 관계적 μœ μ‚¬μ„± 연ꡬλ₯Ό μœ„ν•œ κ·€μ€‘ν•œ μžμ›μ΄ 될 κ²ƒμž…λ‹ˆλ‹€.
β€’
ν˜„μž¬ λͺ¨λΈμ€ 관계적 μœ μ‚¬μ„±μ„ μΈ‘μ •ν•˜λŠ” 첫걸음일 뿐이며, 더 λ‹€μ–‘ν•œ 관계적 논리λ₯Ό ν¬μ°©ν•˜κ³  μ‹€μ œ μ‘μš©μ— μ μš©ν•˜κΈ° μœ„ν•΄μ„œλŠ” 좔가적인 연ꡬ와 κ°œμ„ μ΄ ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘