Sign In

OpaqueToolsBench: Learning Nuances of Tool Behavior Through Interaction

Created by
  • Haebom
Category
Empty

μ €μž

Skyler Hallinan, Thejas Venkatesh, Xiang Ren, Sai Praneeth Karimireddy, Ashwin Paranjape, Yuhao Zhang, Jack Hessel

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ‹€μ œ μ„Έκ³„μ˜ λ³΅μž‘ν•˜κ³  λΆˆλΆ„λͺ…ν•œ 도ꡬ(opaque tools)λ₯Ό LLM μ—μ΄μ „νŠΈκ°€ 효과적으둜 μ‚¬μš©ν•˜λ„λ‘ ν•™μŠ΅μ‹œν‚€λŠ” λ¬Έμ œμ— μ§‘μ€‘ν•©λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ LLM μ—μ΄μ „νŠΈκ°€ μƒν˜Έμž‘μš©μ„ 톡해 λ„κ΅¬μ˜ λ™μž‘ 방식과 μ‹€νŒ¨ λͺ¨λ“œλ₯Ό ν•™μŠ΅ν•˜μ—¬ λ¬Έμ„œλ₯Ό κ°œμ„ ν•˜λŠ” OpaqueToolsBenchλΌλŠ” μƒˆλ‘œμš΄ 벀치마크λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. μ œμ•ˆλœ ToolObserver ν”„λ ˆμž„μ›Œν¬λŠ” 도ꡬ 호좜 κΆ€μ μ—μ„œ 얻은 μ‹€ν–‰ ν”Όλ“œλ°±μ„ κ΄€μ°°ν•˜μ—¬ 도ꡬ λ¬Έμ„œλ₯Ό 반볡적으둜 κ°œμ„ ν•¨μœΌλ‘œμ¨ κΈ°μ‘΄ 방법 λŒ€λΉ„ μš°μˆ˜ν•œ μ„±λŠ₯κ³Ό νš¨μœ¨μ„±μ„ λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM μ—μ΄μ „νŠΈκ°€ λΆˆλΆ„λͺ…ν•œ 도ꡬ ν™˜κ²½μ—μ„œ μƒν˜Έμž‘μš©μ„ 톡해 도ꡬ μ‚¬μš©λ²•μ„ ν•™μŠ΅ν•˜κ³  λ¬Έμ„œλ₯Ό κ°œμ„ ν•  수 μžˆλ‹€λŠ” κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ ToolObserver ν”„λ ˆμž„μ›Œν¬λŠ” λΆˆλΆ„λͺ…ν•œ 도ꡬ ν™˜κ²½μ—μ„œ LLM μ—μ΄μ „νŠΈμ˜ 도ꡬ ν™œμš© λŠ₯λ ₯을 ν–₯μƒμ‹œν‚€λŠ” 데 효과적이며, κΈ°μ‘΄ 방법 λŒ€λΉ„ 더 적은 ν† ν°μœΌλ‘œλ„ μš°μˆ˜ν•œ μ„±λŠ₯을 λ‹¬μ„±ν•©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬μ—μ„œ μ œμ•ˆλœ λ²€μΉ˜λ§ˆν¬μ™€ ν”„λ ˆμž„μ›Œν¬λŠ” μ‹€μ œ μ„Έκ³„μ˜ λ³΅μž‘ν•œ 도ꡬ ν™˜κ²½μ— λŒ€ν•œ LLM μ—μ΄μ „νŠΈμ˜ ν•™μŠ΅ 및 평가λ₯Ό μœ„ν•œ μƒˆλ‘œμš΄ λ°©ν–₯을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ‹€μ œ ν™˜κ²½μ—μ„œμ˜ 도ꡬ 뢈λͺ…확성이 더 λ³΅μž‘ν•˜κ±°λ‚˜ λ‹€μ–‘ν•œ 양상을 띨 경우, ToolObserver ν”„λ ˆμž„μ›Œν¬μ˜ μΌλ°˜ν™” κ°€λŠ₯성에 λŒ€ν•œ 좔가적인 검증이 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘