Sign In

Look Before You Leap: Autonomous Exploration for LLM Agents

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Ziang Ye, Wentao Shi, Yuxin Liu, Yu Wang, Zhengzhou Cai, Yaorui Shi, Qi Gu, Xunliang Cai, Fuli Feng

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM) 기반 μ—μ΄μ „νŠΈκ°€ λ‚―μ„  ν™˜κ²½μ—μ„œ κ²ͺλŠ” μ‘°κΈ° 탐색 μ‹€νŒ¨ 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ 자율 νƒμƒ‰μ˜ μ€‘μš”μ„±μ„ κ°•μ‘°ν•©λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ μ—μ΄μ „νŠΈκ°€ 핡심 μƒνƒœ, 객체, κ°€λŠ₯성을 μ–Όλ§ˆλ‚˜ ν­λ„“κ²Œ λ°œκ²¬ν•˜λŠ”μ§€λ₯Ό μΈ‘μ •ν•˜λŠ” '탐색 체크포인트 컀버리지(Exploration Checkpoint Coverage)'λΌλŠ” 검증 κ°€λŠ₯ν•œ μ§€ν‘œλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. λ˜ν•œ, μž‘μ—… μˆ˜ν–‰κ³Ό 탐색을 λ²ˆκ°ˆμ•„ μˆ˜ν–‰ν•˜κ³  각 μœ ν˜•μ˜ 둀아웃에 λŒ€ν•΄ 검증 κ°€λŠ₯ν•œ λ³΄μƒμœΌλ‘œ μ΅œμ ν™”ν•˜λŠ” ν›ˆλ ¨ μ „λž΅κ³Ό, 정보 μˆ˜μ§‘κ³Ό μž‘μ—… 싀행을 λΆ„λ¦¬ν•˜λŠ” '탐색 ν›„ 행동(Explore-then-Act)' νŒ¨λŸ¬λ‹€μž„μ„ κ°œλ°œν•˜μ—¬ μ—μ΄μ „νŠΈμ˜ μΌλ°˜ν™” μ„±λŠ₯을 ν–₯μƒμ‹œμΌ°μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM μ—μ΄μ „νŠΈμ˜ μΌλ°˜ν™” 및 μ‹€μ œ ν™˜κ²½ 적용 κ°€λŠ₯성을 높이기 μœ„ν•΄μ„œλŠ” λ‹¨μˆœνžˆ μ£Όμ–΄μ§„ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λŠ” 것을 λ„˜μ–΄, ν™˜κ²½μ— λŒ€ν•œ μΆ©λΆ„ν•œ 정보 νšλ“μ„ μœ„ν•œ 자율 탐색 λŠ₯λ ₯이 ν•„μˆ˜μ μž…λ‹ˆλ‹€.
β€’
'탐색 체크포인트 컀버리지'와 같은 검증 κ°€λŠ₯ν•œ μ§€ν‘œλŠ” μ—μ΄μ „νŠΈμ˜ 탐색 ν’ˆμ§ˆμ„ μ •λŸ‰ν™”ν•˜κ³  κ°œμ„ ν•˜λŠ” 데 μœ μš©ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ '탐색 ν›„ 행동' νŒ¨λŸ¬λ‹€μž„μ€ 정보 μˆ˜μ§‘κ³Ό μž‘μ—… μ‹€ν–‰ 단계λ₯Ό λͺ…ν™•νžˆ λΆ„λ¦¬ν•¨μœΌλ‘œμ¨ μ—μ΄μ „νŠΈκ°€ 보닀 μ²΄κ³„μ μœΌλ‘œ ν™˜κ²½μ„ μ΄ν•΄ν•˜κ³  λ³΅μž‘ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λ„λ‘ λ•μŠ΅λ‹ˆλ‹€.
β€’
ν˜„μž¬ μ—°κ΅¬λŠ” 탐색 κ³Όμ •μ˜ νš¨μœ¨μ„±μ΄λ‚˜ 탐색 μ˜ˆμ‚°μ˜ μ΅œμ ν™”μ™€ 같은 츑면에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘