haebom
๋ก๊ทธ์ธ
When to Re-Commit: Temporal Abstraction Discovery for Long-Horizon Vision-Language Reasoning
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
๋น์ด ์์
์ ์
Chen Li, Zhantao Yang, Fangyi Chen, Han Zhang, Anudeepsekhar Bolimera, Marios Savvides
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ์ฅ๊ธฐ ๋น์ -์ธ์ด ์ถ๋ก ์์ ์คํํ ํ๋๋ฟ๋ง ์๋๋ผ ๋ค์ ๊ด์ธก ์ ๊น์ง ์ผ๋ง๋ ๊น์ด ์คํํ ์ง๋ฅผ ๊ฒฐ์ ํ๋ '์ปค๋ฐ๋จผํธ ๊น์ด' ๋ฌธ์ ๋ฅผ ๋ค๋ฃน๋๋ค. ์ฐ๊ตฌ์ง์ ์ด๋ฅผ ๊ณ ์ ๋ ๊ฐ์ด ์๋, ์ ์ฑ ์ ์ํ ์กฐ๊ฑด๋ถ ํ์ต ๊ฐ๋ฅ ๋ณ์๋ก ์ค์ ํ๋ ์๋ก์ด ๋ฐฉ๋ฒ๋ก ์ ์ ์ํฉ๋๋ค. ์ ์๋ ๋ฐฉ๋ฒ์ Sliding Puzzle ๋ฐ Sokoban ํ์คํฌ์์ ๊ณ ์ ๊น์ด ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๋ฅ๊ฐํ๋ฉฐ, ํด๊ฒฐ๋ฅ ์ ๋์ด๊ณ ์คํํ๋ ์์ ํ๋ ์๋ฅผ ์ค์ด๋ ์ฃผ์ ์ฑ๊ณผ๋ฅผ ๋ฌ์ฑํ์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์ฅ๊ธฐ ๋น์ -์ธ์ด ์ถ๋ก ์์ ๋์ ์ผ๋ก ๊ฒฐ์ ๋๋ ์ปค๋ฐ๋จผํธ ๊น์ด๋ ๊ณ ์ ๋ ๊ฐ๋ณด๋ค ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ฅํฉ๋๋ค.
โข
์ ์๋ ๋ชจ๋ธ์ ์ต์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ฌ, ํน์ ํ์คํฌ์์ ๋ ํจ์จ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ ์ ์ํฉ๋๋ค.
โข
์ด๋ก ์ ์ผ๋ก, ์ต์ ์ ์ปค๋ฐ๋จผํธ ๊น์ด๊ฐ ์ํ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ๋ ์ํ ์กฐ๊ฑด๋ถ ์ปค๋ฐ๋จผํธ๋ ๊ณ ์ ๊น์ด๋ณด๋ค ํญ์ ์ฐ์ํจ์ ์ฆ๋ช ํ์ต๋๋ค.
โข
๋ค์ํ ํ๊ฒฝ๊ณผ ๋ ๋ณต์กํ ์ฅ๊ธฐ ์ถ๋ก ํ์คํฌ์ ๋ํ ํ์ฅ์ฑ ๋ฐ ์ผ๋ฐํ ์ฑ๋ฅ์ ๋ํ ์ถ๊ฐ์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Slashpage๋ก ์ ์๋จ