haebom
Sign In
AttenA+: Rectifying Action Inequality in Robotic Foundation Models
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Daojie Peng, Fulong Ma, Jiahang Cao, Qiang Zhang, Xupeng Xie, Jian Guo, Ping Luo, Andrew F. Luo, Boyu Zhou, Jun Ma
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๊ธฐ์กด ๋ก๋ด ํ์ด๋ฐ์ด์ ๋ชจ๋ธ์ด ์๊ฐ์ ๋์ง์ฑ์ ๊ฐ์ ํ์ฌ ๋ชจ๋ ํ๋์ ๋๋ฑํ๊ฒ ํ์ตํ๋ ๋ฌธ์ ์ ์ ์ง์ ํฉ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ์๋ ๊ธฐ๋ฐ์ ํ๋ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ํ์ฉํ์ฌ ์๋๊ฐ ๋๋ฆฐ, ์ฆ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์ค์ํ ๊ตฌ๊ฐ์ ๋ ๋ง์ ํ์ต ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ AttenA+ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. AttenA+๋ ๊ธฐ์กด ๋ชจ๋ธ์ ์ถ๊ฐ์ ์ธ ๊ตฌ์กฐ๋ ๋งค๊ฐ๋ณ์ ์์ด ์ ์ฉ ๊ฐ๋ฅํ๋ฉฐ, ๋ณต์กํ ์ฅ๊ธฐ ๋ก๋ด ์์ ์์์ ์ฑ๋ฅ์ ํฌ๊ฒ ํฅ์์ํต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
ํ๋ ์ํ์ค์ ๋ฌผ๋ฆฌ์ ์ค์๋ ๊ณ ๋ ค:
๋ก๋ด ์์ ์ฑ๊ณต์ ๊ฒฐ์ ์ ์ธ ์ํฅ์ ๋ฏธ์น๋ ๋ฎ์ ์๋์ ์์ง์์ ๋ํ ์ง์ค ํ์ต์ ํตํด ๋ชจ๋ธ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์์ต๋๋ค.
โข
๊ธฐ์กด ๋ชจ๋ธ์ ์ฑ๋ฅ ํฅ์:
AttenA+๋ฅผ ๊ธฐ์กด Vision-Language-Action (VLA) ๋ฐ World-Action Models (WAM) ๋ชจ๋ธ์ ์ ์ฉํจ์ผ๋ก์จ ๋ณ๋์ ๊ตฌ์กฐ ๋ณ๊ฒฝ ์์ด๋ ์ต์ฒจ๋จ ์ฑ๋ฅ์ ๋์ฑ ๋์ด์ฌ๋ฆด ์ ์์ต๋๋ค.
โข
์๋ก์ด ํ์ด๋ฐ์ด์ ๋ชจ๋ธ ๊ตฌ์ถ ๋ฐฉํฅ ์ ์:
ํ๋ ์ํ์ค์ ๋ด์ฌ๋ ๋ฌผ๋ฆฌ์ ๊ตฌ์กฐ ์ ๋ณด๋ฅผ ํ์ฉํ๋ ๊ฒ์ด ๋ก๋ด ์ ์ด ๋ชจ๋ธ์ ํจ์จ์ ์ธ ๋ฐ์ ์ ์ํ ์๋ก์ด ๊ฒฝ๋ก๊ฐ ๋ ์ ์์์ ์์ฌํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage