haebom
Sign In
RESample: A Robust Data Augmentation Framework via Exploratory Sampling for Robotic Manipulation
Created by
Haebom
Category
Empty
์ ์
Yuquan Xue, Guanxing Lu, Zhenyu Wu, Chuanrui Zhang, Bofang Jia, Zhengyi Gu, Ziwei Wang
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๋ก๋ด ์กฐ์ ๋ถ์ผ์์ Vision-Language-Action (VLA) ๋ชจ๋ธ์ ํ์ต ๋ฐ์ดํฐ์ ์ด ์ฑ๊ณต์ ์ธ ๊ถค์ ์ ํธ์ค๋์ด ๋ฐ์ํ ์ ์๋ ๋ถํฌ ์ธ(OOD) ๋ฌธ์ ์ ๋์ํ๊ธฐ ์ํ ๋ฐ์ดํฐ ์ฆ๊ฐ ํ๋ ์์ํฌ์ธ RESample์ ์ ์ํฉ๋๋ค. RESample์ ํ์์ ์ํ๋ง ๋ฉ์ปค๋์ฆ์ ํตํด ์ ์ฑ ๋กค์์ ์ค ์ ์ฌ์ ์ธ ์ปค๋ฒ๋ฆฌ์ง ๊ฒฉ์ฐจ๋ฅผ ์๋ณํ๊ณ , ์ด๋ฅผ ๋ณด์ํ๋ ํ์์ ํ๋์ ์ํ๋งํ์ฌ ํ์ต ๋ฐ์ดํฐ์ ์ ๋ถํฌ ์ปค๋ฒ๋ฆฌ์ง๋ฅผ ํจ์จ์ ์ผ๋ก ํ์ฅํฉ๋๋ค. ๋ํ, ํ์ต ๋ฐ์ดํฐ์ ์ ๋ถํฌ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๋ฐ์ํ๊ธฐ ์ํด ๊ฒฝ๋ ์ปค๋ฒ๋ฆฌ์ง ํจ์๋ฅผ ๋์ ํ์ฌ ์ปค๋ฒ๋ฆฌ์ง ๋ฐ๋๊ฐ ๋ฎ์ ์์ญ์ ์ํ๋ง ๊ณผ์ ์ ์ง์ค์ํต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ธฐ์กด VLA ๋ชจ๋ธ์ด ์ฑ๊ณต ๊ถค์ ์ ํธ์ค๋ ํ์ต ๋ฐ์ดํฐ์ ์ผ๋ก ์ธํด ๋ถํฌ ์ธ ์ํฉ์ ์ทจ์ฝํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ํจ๊ณผ์ ์ธ ๋ฐ์ดํฐ ์ฆ๊ฐ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
โข
์ ์๋ RESample ํ๋ ์์ํฌ๋ ์ ์ ์ถ๊ฐ ์ํ๋ก๋ ๊ธฐ์กด ํ์ต ๋ฐ์ดํฐ์ ์ ์ปค๋ฒ๋ฆฌ์ง๋ฅผ ํฌ๊ฒ ํ์ฅํ์ฌ ๋ก๋ด ์กฐ์ ์ฑ๋ฅ์ 12% ํฅ์์ํค๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
โข
ํ์์ ์ํ๋ง ๊ณผ์ ์ ํจ์จ์ฑ์ ๋์ด๊ธฐ ์ํด ๊ฒฝ๋ ์ปค๋ฒ๋ฆฌ์ง ํจ์๋ฅผ ๋์ ํ์ฌ ์ปค๋ฒ๋ฆฌ์ง ๋ฐ๋๊ฐ ๋ฎ์ ์์ญ์ ๋ํ ์ํ๋ง์ ์ง์ค์ํค๋ ์ ๋ต์ ์ค์ฉ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ ๋๋ค.
โข
(ํ๊ณ์ ๋๋ ํฅํ ๊ณผ์ ) ํ์์ ์ํ๋ง ๋ฉ์ปค๋์ฆ์ ์ค๊ณ๊ฐ ํน์ ๋ก๋ด ์์ ์ด๋ ํ๊ฒฝ์ ๋ฐ๋ผ ์ต์ ํ๋ ํ์๊ฐ ์์ผ๋ฉฐ, ๋ ๋ณต์กํ๊ณ ๋ค์ํ OOD ์๋๋ฆฌ์ค์ ๋ํ ์ผ๋ฐํ ์ฑ๋ฅ ํฅ์ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage