haebom
Sign In
Retrieve-then-Steer: Online Success Memory for Test-Time Adaptation of Generative VLAs
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Jianchao Zhao, Huoren Yang, Hu Yusong, Yuyang Gao, Qiguan Ou, Cong Wan, SongLin Dong, Zhiheng Ma, Yihong Gong
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ ๋ก๋ด ํ๊ฒฝ์์์ VLA(Vision-Language-Action) ๋ชจ๋ธ์ ์ ๋ขฐ๋ ํ๋ฝ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ๊ณ ์ ๋ VLA ๋ชจ๋ธ์ด ์ฑ๊ณต์ ์ธ ํ ์คํธ ๊ฒฝํ์ ์ฌํ์ฉํ์ฌ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋์ง ํ๊ตฌํฉ๋๋ค. ์ด๋ฅผ ์ํด ์ฑ๊ณต์ ์ธ ๊ด์ฐฐ-ํ๋ ์ธ๊ทธ๋จผํธ๋ฅผ ์ ์ฅํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ด๋ จ ํ๋ ์กฐ๊ฐ์ ๊ฒ์, ์ผ๊ด์ฑ ํํฐ๋ง, ๊ทธ๋ฆฌ๊ณ ์๋ฆฌํธ ํ๋ ์ฌ์ (prior)์ผ๋ก ํตํฉํ๋ ์จ๋ผ์ธ ์ฑ๊ณต ๊ธฐ์ต(success-memory) ๊ธฐ๋ฐ ํ ์คํธ ์๊ฐ ์ ์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. ์ด ์๋ฆฌํธ ์ฌ์ ์ ์ค๊ฐ ๋จ๊ณ์์ ํ๋ ์์ฑ๊ธฐ์ ์ฃผ์ ๋๋ฉฐ, ๊ฒ์ ์ ๋ขฐ๋์ ๋ฐ๋ผ ์๋ด ๊ฐ๋๊ฐ ์กฐ์ ๋์ด, ํ๊ฒฝ๋ณ ์ฑ๊ณต ๊ฒฝํ์ ํ์ฉํ๋ฉด์๋ ๊ด์ฐฐ ๊ธฐ๋ฐ์ ์์ฑ์ ๊ฐ์ ์ ์ ์งํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์จ๋ผ์ธ ์ฑ๊ณต ๊ฒฝํ ํ์ฉ:
๋ก๋ด์ด ๋ฐ๋ณต๋๋ ํ๊ฒฝ์์ ์ป์ ์ฑ๊ณต์ ์ธ ๊ฒฝํ์ ํ์ต ๋ฐ์ดํฐ๋ก ํ์ฉํ์ฌ, ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ง์์ ์ผ๋ก ๊ฐ์ ํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.
โข
๋น๋ชจ์์ ๊ฒฝ๋ ์ ์:
๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ ์์ด, ๊ฒ์ ๋ฐ ํตํฉ ๊ณผ์ ์ ํตํด ํจ์จ์ ์ผ๋ก ํ ์คํธ ์๊ฐ์ ์ ์์์ผ ์ค์๊ฐ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋์ ๋๋ค.
โข
์์ ์ฑ ๋ฐ ๋ณต์กํ ํ์คํฌ ์ฑ๋ฅ ํฅ์:
๊ธด ์๊ฐ์ด๋ ๋ค๋จ๊ณ๋ก ๊ตฌ์ฑ๋ ๋ณต์กํ ๋ก๋ด ํ์คํฌ์์ ํนํ ์ฑ๋ฅ ํฅ์๊ณผ ์์ ์ฑ ์ฆ๋๋ฅผ ๋ฌ์ฑํ์ต๋๋ค.
โข
์ฑ๊ณต ๊ฒฝํ์ ์ง์ ๋ฌธ์ :
์ ์ฅ๋๋ ์ฑ๊ณต ๊ฒฝํ์ ํ์ง์ด ๋ฎ๊ฑฐ๋, ํ๊ฒฝ ๋ณํ๊ฐ ๋๋ฌด ๋น ๋ฅผ ๊ฒฝ์ฐ ์ฑ๋ฅ ํฅ์์ ์ ์ฝ์ด ์์ ์ ์์ต๋๋ค.
โข
๊ฒ์ ๋ฐ ํตํฉ ๋ฉ์ปค๋์ฆ์ ํจ์จ์ฑ:
๋๊ท๋ชจ ๋ฉ๋ชจ๋ฆฌ๋ ๋ณต์กํ ๊ฒ์ ๊ท์น์ ๊ณ์ฐ ๋น์ฉ์ ์ฆ๊ฐ์ํฌ ์ ์์ผ๋ฉฐ, ์ด์ ๋ํ ์ถ๊ฐ์ ์ธ ์ต์ ํ๊ฐ ํ์ํ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage