haebom
Sign In
Dual-Anchoring: Addressing State Drift in Vision-Language Navigation
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Kangyi Wu, Pengna Li, Kailin Lyu, Xi Lin, Lin Zhao, Qingrong He, Jinjun Wang, Jianyi Liu
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μμ°μ΄ μ§μλ₯Ό λ°λΌ 3D νκ²½μ νμνλ λΉμ -μΈμ΄ λ΄λΉκ²μ΄μ (VLN)μμ λ°μνλ 'μν λ리ννΈ' λ¬Έμ λ₯Ό ν΄κ²°νκ³ μ ν©λλ€. μ΄λ₯Ό μν΄, μλ£λ νμ λͺ©νμ λ¨μ νμ λͺ©νλ₯Ό ꡬλΆνλλ‘ μ§μ μ§ν μν©μ κ³ μ νλ 'Instruction Progress Anchoring'κ³Ό κ³Όκ±° κ΄μ°°μ λͺ ννκ² κ²μ¦νκ³ λ°©λ¬Έν λλλ§ν¬μ ννμ μ μ§νλλ‘ μ λνλ 'Memory Landmark Anchoring'μ ν¬ν¨νλ 'Dual-Anchoring Framework'λ₯Ό μ μν©λλ€. μ μλ λ°©λ²μ κΈ΄ μλ리μ€μμ μν λ리ννΈλ‘ μΈν μ€ν¨λ₯Ό ν¬κ² μ€μ¬ μ±κ³΅λ₯ μ ν₯μμμΌ°μ΅λλ€.
π μμ¬μ λ° νκ³
β’
λͺ νν νμ λͺ©ν μΆμ
: μ μλ λ°©λ²λ‘ μ μμ΄μ νΈκ° μ§μμ μ§ν μν©μ λͺ ννκ² μΈμ§νκ³ κ΅¬λΆνλλ‘ ν¨μΌλ‘μ¨, μ₯거리 μ무 μν μ λͺ©ν λ¬μ±λ₯ μ λμΌ μ μμ΅λλ€.
β’
κΈ°μ΅λ ₯ λ° λλλ§ν¬ μΈμ κ°ν
: κ³Όκ±° κ΄μ°°μ λλμλ³΄κ³ λλλ§ν¬λ₯Ό μ¬νμΈνλ λ©μ»€λμ¦μ μμ΄μ νΈμ κΈ°μ΅λ ₯ μ νλ‘ μΈν νΌλμ μ€μ΄κ³ , μ€μν μ§μ μ λμΉμ§ μλλ‘ λμ΅λλ€.
β’
λ°μ΄ν°μ ꡬμΆμ μ€μμ±
: λ κ°μ λκ·λͺ¨ λ°μ΄ν°μ ꡬμΆμ μ μλ λ°©λ²λ‘ μ ν¨κ³Όμ μΈ νμ΅κ³Ό κ²μ¦μ κ°λ₯νκ² νμΌλ©°, μ΄λ ν₯ν VLN μ°κ΅¬μλ κΈ°μ¬ν κ²μ λλ€.
β’
λ°μ΄ν° μμ± λ° λͺ¨λΈ 볡μ‘μ±
: μλ‘κ² κ΅¬μΆλ λ°μ΄ν°μ μ λ°©λν κ·λͺ¨μ μ μλ λ°©λ²λ‘ μ 볡μ‘μ±μ μ€μ μ μ© μ κ³μ° μμ λ° κ΅¬νμ μ΄λ €μμ μΌκΈ°ν μ μμ΅λλ€.
PDF 보기
Made with Slashpage