Sign In

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Created by
  • Haebom
Category
Empty

μ €μž

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi Thomas

πŸ’‘ κ°œμš”

λ³Έ 논문은 LLM 기반 μ—μ΄μ „νŠΈκ°€ μ‹€ν–‰ κ²½ν—˜μœΌλ‘œλΆ€ν„° ν•™μŠ΅ν•˜μ—¬ 미래 μ„±λŠ₯을 κ°œμ„ ν•˜λŠ” 데 어렀움을 κ²ͺλŠ” 문제λ₯Ό ν•΄κ²°ν•˜κ³ μž ν•©λ‹ˆλ‹€. μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬λŠ” μ—μ΄μ „νŠΈ μ‹€ν–‰ κΆ€μ μ—μ„œ 행동 κ°€λŠ₯ν•œ ν•™μŠ΅ λ‚΄μš©μ„ μžλ™μœΌλ‘œ μΆ”μΆœν•˜κ³ , 이λ₯Ό 톡해 μ»¨ν…μŠ€νŠΈ 기반 λ©”λͺ¨λ¦¬ 검색을 ν™œμš©ν•˜μ—¬ 미래 μ„±λŠ₯을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, AppWorld λ²€μΉ˜λ§ˆν¬μ—μ„œ μ΅œλŒ€ 14.3%p의 μ‹œλ‚˜λ¦¬μ˜€ λͺ©ν‘œ 달성λ₯  ν–₯상을 λ³΄μ˜€μœΌλ©°, 특히 λ³΅μž‘ν•œ μž‘μ—…μ—μ„œ 149%의 μƒλŒ€μ  증가λ₯Ό κΈ°λ‘ν•˜λ©° μƒλ‹Ήν•œ κ°œμ„  효과λ₯Ό μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM μ—μ΄μ „νŠΈκ°€ λ‹¨μˆœνžˆ κ³Όκ±° 데이터λ₯Ό μ €μž₯ν•˜λŠ” 것을 λ„˜μ–΄, μ‹€ν–‰ ꢀ적 뢄석을 톡해 ꡬ체적이고 κ΅¬μ‘°ν™”λœ ν•™μŠ΅ λ‚΄μš©μ„ μΆ”μΆœν•˜κ³  이λ₯Ό 적극적으둜 ν™œμš©ν•  수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬λŠ” μ‹€νŒ¨ 회볡, νš¨μœ¨μ„± μ΅œμ ν™” λ“± λ‹€μ–‘ν•œ μΈ‘λ©΄μ—μ„œ μ—μ΄μ „νŠΈμ˜ μ„±λŠ₯을 μ²΄κ³„μ μœΌλ‘œ κ°œμ„ ν•  수 μžˆλŠ” κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
ν˜„μž¬ μ—°κ΅¬λŠ” AppWorld λ²€μΉ˜λ§ˆν¬μ— μ΄ˆμ μ„ λ§žμΆ”κ³  있으며, λ‹€μ–‘ν•œ μ’…λ₯˜μ˜ μž‘μ—…κ³Ό ν™˜κ²½μ—μ„œμ˜ μΌλ°˜ν™” μ„±λŠ₯ 및 μƒˆλ‘œμš΄ μœ ν˜•μ˜ 였λ₯˜λ‚˜ ν•™μŠ΅μ— λŒ€ν•œ λŒ€μ‘ λŠ₯λ ₯에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘