haebom
Sign In
MemQ: Integrating Q-Learning into Self-Evolving Memory Agents over Provenance DAGs
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Junwei Liao, Haoting Shi, Ruiwen Zhou, Jiaqian Wang, Shengtao Zhang, Wei Zhang, Weinan Zhang, Ying Wen, Zhiyu Li, Feiyu Xiong, Bo Tang, Muning Wen
๐ก ๊ฐ์
๊ธฐ์กด์ LLM ์์ด์ ํธ๋ค์ ๊ฐ ๊ธฐ์ต์ ๋ ๋ฆฝ์ ์ผ๋ก ์ฒ๋ฆฌํ์ฌ ๊ธฐ์ต ๊ฐ์ ์์กด์ฑ ์ฌ์ฌ์ ๊ฐ๊ณผํ์ต๋๋ค. ๋ณธ ๋ ผ๋ฌธ์ provenance DAG๋ฅผ ํตํด ๊ธฐ์ต ๊ฐ์ ์ ์ฉ ์ ๋ฌ์ ์ถ์ ํ๋ MemQ๋ฅผ ์ ์ํ๋ฉฐ, ์ด๋ ์๊ฐ์ ๊ฑฐ๋ฆฌ๊ฐ ์๋ ๊ตฌ์กฐ์ ๊ทผ์ ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ์ ์ฉ์ ๋ถ๋ฐฐํฉ๋๋ค. MemQ๋ 6๊ฐ์ง ๋ค์ํ ๋ฒค์น๋งํฌ์์ ์ต๊ณ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ผ๋ฉฐ, ํนํ ๋ค๋จ๊ณ ์์ ์์ ํฐ ์ฑ๋ฅ ํฅ์์ ๋ณด์์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ธฐ์ต ๊ฐ์ ๋ณต์กํ ์์กด์ฑ์ ํจ๊ณผ์ ์ผ๋ก ๋ชจ๋ธ๋งํ์ฌ LLM ์์ด์ ํธ์ ํ์ต ๋ฐ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํฌ ์ ์์ต๋๋ค.
โข
Exogenous-Context MDP ํ๋ ์์ํฌ๋ ๊ธฐ์ต ๊ด๋ฆฌ ๋ฌธ์ ๋ฅผ ๊ตฌ์กฐํํ๊ณ ๋ถ์ํ๋ ๋ฐ ์ ์ฉํ ํ์ ์ ๊ณตํฉ๋๋ค.
โข
$\gamma$์ $\lambda$์ ๊ฐ์ ํ๋ผ๋ฏธํฐ๊ฐ EC-MDP ๊ตฌ์กฐ์ ์ด๋ป๊ฒ ์ํธ์์ฉํ๋์ง์ ๋ํ ์ฌ์ธต์ ์ธ ์ดํด๋ฅผ ๋ฐํ์ผ๋ก ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
โข
ํ์ฌ๋ ์ฝ๋ ๊ณต๊ฐ๊ฐ ์์ ๋์ด ์์ผ๋ฉฐ, ์ค์ ์์คํ ์ ์ฉ ๋ฐ scalability์ ๋ํ ์ถ๊ฐ์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage