haebom
Sign In
EvoSkills: Self-Evolving Agent Skills via Co-Evolutionary Verification
Created by
Haebom
Category
Empty
์ ์
Hanrong Zhang, Shicheng Fan, Henry Peng Zou, Yankai Chen, Zhenting Wang, Jiayu Zhou, Chengze Li, Wei-Chieh Huang, Yifei Yao, Kening Zheng, Xue Liu, Xiaoxiao Li, Philip S. Yu
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ ๊ธฐ์กด LLM ์์ด์ ํธ์ ๋จ์ํ ๋๊ตฌ ํธ์ถ๋ก๋ ํด๊ฒฐํ๊ธฐ ์ด๋ ค์ด ๋ค๋จ๊ณ ์ ๋ฌธ ์์ ์ ์ํํ๊ธฐ ์ํ '์คํฌ' ๊ฐ๋ ์ ํ์ฅํ์ฌ, ์์ด์ ํธ๊ฐ ์ค์ค๋ก ๋ณต์กํ ๋ค์ค ํ์ผ ์คํฌ ํจํค์ง๋ฅผ ์์ฑํ๋๋ก ํ๋ EvoSkills ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. EvoSkills๋ ์คํฌ ์์ฑ๊ธฐ์ ํ๋ ฅ์ ๊ฒ์ฆ๊ธฐ๋ฅผ ๊ฒฐํฉํ์ฌ, ์ค์ ํ ์คํธ ๋ฐ์ดํฐ ์์ด๋ ์ ์ตํ๊ณ ์คํ ๊ฐ๋ฅํ ํผ๋๋ฐฑ์ ์ ๊ณตํจ์ผ๋ก์จ ์คํฌ์ ๋ฐ๋ณต์ ์ผ๋ก ๊ฐ์ ํฉ๋๋ค. ์คํ ๊ฒฐ๊ณผ, EvoSkills๋ SkillsBench์์ ๋์ ํต๊ณผ์จ์ ๋ฌ์ฑํ๋ฉฐ ์ฌ๋ฌ LLM์ ๋ํ ๊ฐ๋ ฅํ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ์ ์ฆํ์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์๋ํ๋ ๋ณต์ก ์คํฌ ์์ฑ:
EvoSkills๋ ๋ ์ด๋ธ ์ง์ฝ์ ์ด๊ณ ์ธ๊ฐ-๊ธฐ๊ณ ์ธ์ง ๋ถ์ผ์น ๋ฌธ์ ๋ฅผ ๊ฒช๋ ๊ธฐ์กด ์คํฌ ์์ฑ ๋ฐฉ์์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ , ์์ด์ ํธ๊ฐ ๋ณต์กํ ๋ค์ค ํ์ผ ์คํฌ์ ์์จ์ ์ผ๋ก ์์ฑํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.
โข
ํจ๊ณผ์ ์ธ ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ:
์ค์ ์ ๋ต ์์ด๋ ์ ์ตํ๊ณ ์คํ ๊ฐ๋ฅํ ํผ๋๋ฐฑ์ ์ ๊ณตํ๋ ํ๋ ฅ์ ๊ฒ์ฆ๊ธฐ(Surrogate Verifier)์ ๊ฐ๋ฐ์, ๊ณ ๋๋ก ๋ณต์กํ ์คํฌ์ ์๋ ๊ฒ์ฆ์ ๊ฐ๋ฅํ๊ฒ ํ๋ ์๋ก์ด ์ ๊ทผ ๋ฐฉ์์ ์ ์ํฉ๋๋ค.
โข
์ผ๋ฐํ ์ฑ๋ฅ:
์ ์๋ ํ๋ ์์ํฌ๊ฐ ๋ค์ํ LLM์ ๊ฑธ์ณ ์ฐ์ํ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๋ณด์ฌ, ๋ฒ์ฉ์ ์ธ ์คํฌ ์๋ ์์ฑ ์์คํ ๊ตฌ์ถ ๊ฐ๋ฅ์ฑ์ ์์ฌํฉ๋๋ค.
โข
๊ฒ์ฆ๊ธฐ์ ์ ๋ณด๋ ๋ฐ ์ ํ์ฑ:
๊ฒ์ฆ๊ธฐ๊ฐ ์ ๊ณตํ๋ ํผ๋๋ฐฑ์ ์ ๋ณด๋๊ณผ ์ค์ ์ฑ๋ฅ ํฅ์์ ๊ธฐ์ฌํ๋ ์ ํ์ฑ์ด ์ผ๋ง๋ ๋์์ง์ ๋ํ ์ถ๊ฐ์ ์ธ ๋ถ์์ด ํ์ํ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage