haebom
Sign In
RoboSSM: Scalable In-context Imitation Learning via State-Space Models
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Youngju Yoo, Jiaheng Hu, Yifeng Zhu, Bo Liu, Qiang Liu, Roberto Mart
in-Mart
in, Peter Stone
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ ๋ช ๊ฐ์ ์์ฐ๋ง์ผ๋ก ๋ก๋ด์ด ์๋ก์ด ์์ ์ ํ์ตํ ์ ์๋๋ก ํ๋ ์ธ์ปจํ ์คํธ ๋ชจ๋ฐฉ ํ์ต(ICIL)์ ํ์ฅ์ฑ์ ๋์ด๋ ๋ฐ ์ด์ ์ ๋ง์ถฅ๋๋ค. ๊ธฐ์กด์ Transformer ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ์ด ๊ฐ์ง ๊ณ์ฐ ๋ณต์ก์ฑ๊ณผ ๊ธด ํ๋กฌํํธ ์ฒ๋ฆฌ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด, ์ ํ ์๊ฐ ์ถ๋ก ๊ณผ ๋ฐ์ด๋ ์ธ์ฝ ๋ฅ๋ ฅ์ ๊ฐ์ถ ์ต์ฒจ๋จ ์ํ ๊ณต๊ฐ ๋ชจ๋ธ(SSM)์ธ Longhorn์ ํ์ฉํ RoboSSM์ ์ ์ํฉ๋๋ค. ์ด๋ฅผ ํตํด ํ์ต ๋ฐ์ดํฐ์ ์๋ ๊ธด ์์ ์ด๋ ์ฅ๊ธฐ์ ์ธ ์์ ์ ํฌํจํ๋ ํ๋กฌํํธ์ ๋ํด Transformer ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ณด๋ค ์ฐ์ํ ์ผ๋ฐํ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ฉฐ ICIL์ ์ํ ํจ์จ์ ์ด๊ณ ํ์ฅ ๊ฐ๋ฅํ ๋ฐฑ๋ณธ์ผ๋ก์ SSM์ ๊ฐ๋ฅ์ฑ์ ์ ์ฆํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์ํ ๊ณต๊ฐ ๋ชจ๋ธ(SSM)์ด ์ธ์ปจํ ์คํธ ๋ชจ๋ฐฉ ํ์ต(ICIL)์ ํจ๊ณผ์ ์ด๋ฉฐ, ํนํ ๊ธด ํ๋กฌํํธ ์ฒ๋ฆฌ ๋ฐ ์ธ์ฝ ๋ฅ๋ ฅ์์ Transformer ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ์ ๋ฅ๊ฐํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.
โข
RoboSSM์ ๊ธฐ์กด ICIL ๋ฐฉ๋ฒ์ ๊ณ์ฐ ๋ณ๋ชฉ ํ์์ ํด๊ฒฐํ๊ณ , ์ค์ ๋ก๋ด ํ๊ฒฝ์์ ๋ ๋ณต์กํ๊ณ ๊ธด ์์ ์ ๋ํ ์ ์์ฑ์ ํฅ์์ํฌ ์ ์๋ ํ์ฅ ๊ฐ๋ฅํ ์๋ฃจ์ ์ ์ ๊ณตํฉ๋๋ค.
โข
ํฅํ ์ฐ๊ตฌ๋ ๋ค์ํ ๋ก๋ด ์์ ๋ฐ ํ๊ฒฝ์ ๋ํ RoboSSM์ ์ผ๋ฐํ ์ฑ๋ฅ์ ๋์ฑ ๊ฒ์ฆํ๊ณ , SSM ์ํคํ ์ฒ ์์ฒด๋ฅผ ICIL์ ์ต์ ํํ๋ ๋ฐฉํฅ์ผ๋ก ์งํ๋ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage