์ผ๋ฐํ๋ ๊ตฌํ์ฒด ์์ด์ ํธ ๊ฐ๋ฐ์ ์ํด ์๊ฐ, ์ธ์ด ์ดํด, ํ๋ ํตํฉ์ ํ์์ฑ์ด ๋๋๋์์ผ๋, ๊ธฐ์กด Vision-Language-Action (VLA) ์ฐ๊ตฌ๋ ํํธํ๋ ์ํคํ
์ฒ์ ํ๊ฐ ํ๋กํ ์ฝ๋ก ์ธํด ๋น๊ต ๋ฐ ์ฌํ์ด ์ด๋ ค์ ์ต๋๋ค. ๋ณธ ๋
ผ๋ฌธ์ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ชจ๋์ ๋ฐฑ๋ณธ-์ก์
ํค๋ ๊ตฌ์กฐ, ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ํ์ต ์ ๋ต, ๊ทธ๋ฆฌ๊ณ ํตํฉ๋ ํ๊ฐ ์ธํฐํ์ด์ค๋ฅผ ์ ๊ณตํ๋ ์คํ์์ค VLA ์ฐ๊ตฌ ์ฝ๋๋ฒ ์ด์ค์ธ StarVLA๋ฅผ ์ ์ํฉ๋๋ค. StarVLA๋ ์ต์ํ์ ๋ฐ์ดํฐ ์์ง๋์ด๋ง์ผ๋ก๋ ๊ธฐ์กด ๋ฐฉ๋ฒ์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์ฌ, VLA ์ฐ๊ตฌ์ ์ง์
์ฅ๋ฒฝ์ ๋ฎ์ถ ๊ฒ์ผ๋ก ๊ธฐ๋๋ฉ๋๋ค.