haebom
Sign In
NaturalGAIA: A Verifiable Benchmark and Hierarchical Framework for Long-Horizon GUI Tasks
Created by
Haebom
Category
Empty
์ ์
Zihan Zheng, Tianle Cui, Taoran Wang, Fengtao Wang, Jiahui Pan, Lewei He, Qianglong Chen
๐ก ๊ฐ์
LLM ๊ธฐ๋ฐ GUI ์์ด์ ํธ ๋ถ์ผ๋ ํ์ค์ ์ธ ํ๊ฒฝ ๊ตฌํ๊ณผ ๊ฒ์ฆ ๊ฐ๋ฅํ ํ๊ฐ ์ ํ๋ ํ๋ณด๋ผ๋ ๊ณผ์ ๋ฅผ ์๊ณ ์์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ณธ ๋ ผ๋ฌธ์ ์ค์ ์ธ๊ฐ์ GUI ์ํธ์์ฉ ์๋๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ๊ฒ์ฆ ๊ฐ๋ฅํ ํ๊ฐ ๋ฐ์ดํฐ์ ์ธ NaturalGAIA๋ฅผ ์ ์ํฉ๋๋ค. NaturalGAIA๋ ์ธ์ง์ ๋น์ ํ์ฑ๊ณผ ๋งฅ๋ฝ ์์กด์ฑ์ ํน์ง์ผ๋ก ํ๋ ์์ฐ์ค๋ฌ์ด ์ธ๊ฐ์ ์๋๋ฅผ ์๊ฒฉํ๊ฒ ์๋ฎฌ๋ ์ด์ ํ๋ฉฐ, LightManus-Jarvis๋ผ๋ ๊ณ์ธต์ ํ์ ํ๋ ์์ํฌ๋ฅผ ํตํด ๋ณต์กํ ์์ฐํ๋ ์์ ์ ์ฒ๋ฆฌํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
ํ์ค์ ์ธ ์ธ๊ฐ์ GUI ์ํธ์์ฉ ์๋๋ฅผ ๋ฐ์ํ ๊ฒ์ฆ ๊ฐ๋ฅํ ๋ฐ์ดํฐ์ ๊ตฌ์ถ์ ์ค์์ฑ์ ์ ์ํฉ๋๋ค.
โข
๋์ ์ธ ๊ณํ ์๋ฆฝ๊ณผ ๋งฅ๋ฝ ์งํ๋ฅผ ๋ด๋นํ๋ LightManus์ ์คํ ์ ํ๋๋ฅผ ๋ณด์ฅํ๋ Jarvis์ ํ์ ์ ํตํด ๋ณต์กํ GUI ํ์คํฌ ์ํ ๋ฅ๋ ฅ์ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค.
โข
์ ์๋ ๋ชจ๋ธ์ ๊ธฐ์กด ์ต์ฒจ๋จ ๋ชจ๋ธ ๋๋น ์ฑ๋ฅ์ ํฌ๊ฒ ๋ฐ์ด๋์ผ๋ฉด์๋ ํ ํฐ ์๋น์ ์คํ ์๊ฐ์ ํ๊ธฐ์ ์ผ๋ก ์ค์ฌ ํจ์จ์ฑ์ ์ ์ฆํ์ต๋๋ค.
โข
ํฅํ ์ฐ๊ตฌ์์๋ ๋ณด๋ค ๊ด๋ฒ์ํ GUI ์์ ์ ํ๊ณผ ๋ณต์ก์ฑ์ ํฌ๊ดํ๊ณ , ์ค์ ์ฌ์ฉ์ ํ๊ฒฝ์์์ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋์ฑ ์ฌ๋ ์๊ฒ ํ๊ตฌํ ํ์๊ฐ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage