Sign In

Dual-Anchoring: Addressing State Drift in Vision-Language Navigation

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Kangyi Wu, Pengna Li, Kailin Lyu, Xi Lin, Lin Zhao, Qingrong He, Jinjun Wang, Jianyi Liu

πŸ’‘ κ°œμš”

λ³Έ 논문은 λ³΅μž‘ν•œ 3D ν™˜κ²½μ—μ„œ μžμ—°μ–΄ μ§€μ‹œλ₯Ό λ”°λ₯΄λŠ” μ—μ΄μ „νŠΈμ˜ λΉ„μ „-μ–Έμ–΄ 탐색(VLN) μ„±λŠ₯을 μ €ν•΄ν•˜λŠ” 'μƒνƒœ λ“œλ¦¬ν”„νŠΈ' 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ μ œμ•ˆλœ Dual-Anchoring ν”„λ ˆμž„μ›Œν¬λ₯Ό μ†Œκ°œν•©λ‹ˆλ‹€. μ œμ•ˆλœ 방법은 μ§„ν–‰ 상황 λ“œλ¦¬ν”„νŠΈμ™€ κΈ°μ–΅ λ“œλ¦¬ν”„νŠΈλΌλŠ” 두 κ°€μ§€ μ£Όμš” 인지적 결함을 λͺ…μ‹œμ μœΌλ‘œ κ³ μ •ν•¨μœΌλ‘œμ¨ μ—μ΄μ „νŠΈμ˜ 길을 μžƒλŠ” ν˜„μƒμ„ λ°©μ§€ν•©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, μ œμ•ˆλœ 방법은 κΈ΄ 경둜 νƒμƒ‰μ—μ„œ 성곡λ₯ μ„ 크게 ν–₯μƒμ‹œμΌ°μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
λͺ…μ‹œμ μΈ μ§„ν–‰ 상황 좔적: μ—μ΄μ „νŠΈκ°€ μ™„λ£Œλœ ν•˜μœ„ λͺ©ν‘œμ™€ 남은 λͺ©ν‘œλ₯Ό κ΅¬λΆ„ν•˜λ„λ‘ ν…μŠ€νŠΈ 토큰 생성을 μ§€λ„ν•¨μœΌλ‘œμ¨, μ—μ΄μ „νŠΈκ°€ ν˜„μž¬ μ§„ν–‰ 상황을 λͺ…ν™•νžˆ μΈμ§€ν•˜λ„λ‘ λ•μŠ΅λ‹ˆλ‹€.
β€’
λžœλ“œλ§ˆν¬ 기반 κΈ°μ–΅ κ°•ν™”: κ³Όκ±° κ΄€μ°° λ‚΄μš©μ„ 객체 쀑심 μž„λ² λ”©μœΌλ‘œ 회고적으둜 μ˜ˆμΈ‘ν•˜λŠ” λžœλ“œλ§ˆν¬ 쀑심 세계 λͺ¨λΈμ„ ν™œμš©ν•˜μ—¬, μ—μ΄μ „νŠΈκ°€ λ°©λ¬Έν•œ λžœλ“œλ§ˆν¬λ₯Ό λͺ…ν™•ν•˜κ²Œ κ΅¬λΆ„ν•˜κ³  κΈ°μ–΅μ˜ 손상을 λ°©μ§€ν•©λ‹ˆλ‹€.
β€’
데이터셋 κ΅¬μΆ•μ˜ μ€‘μš”μ„±: λͺ…μ‹œμ μΈ μ§„ν–‰ 상황 μ„€λͺ…κ³Ό λžœλ“œλ§ˆν¬ 검증을 μœ„ν•œ λŒ€κ·œλͺ¨ 데이터셋을 κ΅¬μΆ•ν•¨μœΌλ‘œμ¨, μ œμ•ˆλœ λ°©λ²•λ‘ μ˜ 효과λ₯Ό μž…μ¦ν•˜κ³  ν–₯ν›„ 연ꡬλ₯Ό μœ„ν•œ κΈ°λ°˜μ„ λ§ˆλ ¨ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
ν–₯ν›„ 과제: μ—μ΄μ „νŠΈμ˜ ν•™μŠ΅ 및 μΆ”λ‘  κ³Όμ •μ—μ„œ λ°œμƒν•˜λŠ” 잠재적인 μ˜€λ²„ν—€λ“œ λ˜λŠ” 좔가적인 κ³„μ‚°λŸ‰μ— λŒ€ν•œ 뢄석이 ν•„μš”ν•˜λ©°, λ‹€μ–‘ν•œ ν™˜κ²½ 및 μ§€μ‹œ μŠ€νƒ€μΌμ— λŒ€ν•œ μΌλ°˜ν™” μ„±λŠ₯을 λ”μš± 탐ꡬ할 ν•„μš”κ°€ μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘