haebom
Sign In
NavOne: One-Step Global Planning for Vision-Language Navigation on Top-Down Maps
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Dijia Zhan, Jinyi Li, Chenxi Zheng, Shaoyu Huang, Yong Li, Jie Tang, Xuemiao Xu
๐ก ๊ฐ์
๊ธฐ์กด ๋น์ -์ธ์ด ๋ด๋น๊ฒ์ด์ (VLN) ๋ฐฉ๋ฒ๋ก ์ ์ค๋ฅ ๋์ ๋ฐ ๋นํจ์จ์ฑ ๋ฌธ์ ๋ฅผ ๊ฒช๋ ๋จ๊ณ๋ณ ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค. ๋ณธ ๋ ผ๋ฌธ์ ์ฌ์ ๊ตฌ์ถ๋ ์ ์ญ ์ง๋๋ฅผ ํ์ฉํ์ฌ ๋ด๋น๊ฒ์ด์ ์ ํ๋์ ๋จ๊ณ๋ก ํตํฉํ๋ ์๋ก์ด Top-Down VLN(TD-VLN) ํจ๋ฌ๋ค์์ ์ ์ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์ ์๋ NavOne ํ๋ ์์ํฌ๋ ๋ค์ค ๋ชจ๋ ์ง๋์์ ๋จ์ผ ์๋ฐฉํฅ ํจ์ค๋ก ๊ฒฝ๋ก ํ๋ฅ ์ ์ง์ ์์ธกํ์ฌ ํจ์จ์ ์ธ ์ ์ญ ๊ฒฝ๋ก ๊ณํ์ ๋ฌ์ฑํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์ ์ญ์ ์ด๊ณ ํจ์จ์ ์ธ ๊ฒฝ๋ก ๊ณํ:
NavOne์ ๊ธฐ์กด์ ๋จ๊ณ๋ณ VLN ๋ฐฉ์์ ์ค๋ฅ ๋์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ , 8๋ฐฐ์ ์๋ ํฅ์์ ํตํด ํจ์จ์ ์ธ ์ ์ญ ๊ฒฝ๋ก ๊ณํ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
โข
์๋ก์ด TD-VLN ํจ๋ฌ๋ค์ ๋ฐ ๋ฐ์ดํฐ์ :
Top-Down Map Fuser์ Attention Residuals๋ฅผ ํฌํจํ๋ NavOne์ ์๋กญ๊ฒ ๊ตฌ์ถ๋ R2R-TopDown ๋ฐ์ดํฐ์ ์์ ํจ๊ณผ์ ์ธ ์ฑ๋ฅ์ ์ ์ฆํ๋ฉฐ TD-VLN ๋ถ์ผ์ ๋ฐ์ ์ ๊ธฐ์ฌํฉ๋๋ค.
โข
์ง๋ ์ ๋ณด ์์กด์ฑ ๋ฐ ์ผ๋ฐํ:
์ ์๋ ๋ฐฉ๋ฒ๋ก ์ ์ฌ์ ๊ตฌ์ถ๋ ์ ์ญ ์ง๋ ์ ๋ณด์ ์์กดํ๋ฏ๋ก, ์ง๋ ์ ๋ณด๊ฐ ๋ถ์กฑํ๊ฑฐ๋ ๋์ ์ผ๋ก ๋ณํํ๋ ํ๊ฒฝ์์์ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋ํ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage