Sign In

Toward Template-Free Explainability for Monte Carlo Tree Search

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Siqi Lu, Mirsaleh Bahavarnia, Hiba Baroud, Yixuan Zhang, Hemant Purohit, Ayan Mukhopadhyay

πŸ’‘ κ°œμš”

λ³Έ 논문은 λΆˆν™•μ‹€μ„± ν•˜μ˜ 순차적 μ˜μ‚¬ κ²°μ • 문제 해결에 효과적인 MCTS(Monte Carlo Tree Search)의 해석 κ°€λŠ₯성을 λ†’μ΄λŠ” μƒˆλ‘œμš΄ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. κΈ°μ‘΄ 방법과 달리 μˆ˜λ™μœΌλ‘œ μ •μ˜λœ μ œμ•½ 쑰건 없이 LLM(λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ)을 ν™œμš©ν•˜μ—¬ MCTS 탐색 κ³Όμ •μ˜ 증거 기반 μ„€λͺ…을 μžλ™μœΌλ‘œ μƒμ„±ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 LLM이 쀑간 ν˜•μ‹ ν‘œν˜„ 없이 MCTS μ˜μ‚¬ 결정에 λŒ€ν•œ 쒅단 κ°„ μ„€λͺ…μžλ‘œ ν™œμš©λ  수 μžˆμŒμ„ μž…μ¦ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
MCTS와 같이 λ³΅μž‘ν•œ ν™•λ₯ μ  탐색 μ•Œκ³ λ¦¬μ¦˜μ— λŒ€ν•œ LLM 기반의 μžλ™ν™”λœ μ„€λͺ… 생성 κ°€λŠ₯성을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μˆ˜λ™μœΌλ‘œ μ •μ˜ν•΄μ•Ό ν–ˆλ˜ ν˜•μ‹ 논리 μ œμ•½ 쑰건의 ν•„μš”μ„±μ„ μ œκ±°ν•˜μ—¬ MCTS μ„€λͺ…μ˜ μ ‘κ·Όμ„±κ³Ό μœ μ—°μ„±μ„ λ†’μž…λ‹ˆλ‹€.
β€’
LLM이 MCTS κ²°μ •μ˜ κ·Όκ±°λ₯Ό 효과적으둜 μΆ”μ ν•˜κ³  μ„€λͺ…ν•  수 μžˆμŒμ„ μ‹€ν—˜μ μœΌλ‘œ μž…μ¦ν•©λ‹ˆλ‹€.
β€’
LLM이 μ„€λͺ… 생성에 ν•„μš”ν•œ μΆ©λΆ„ν•œ 증거λ₯Ό 탐색 νŠΈλ¦¬μ—μ„œ μ°Ύμ§€ λͺ»ν•  경우, λͺ©ν‘œ μ§€ν–₯적 트리λ₯Ό ν™•μž₯ν•˜λŠ” λ©”μ»€λ‹ˆμ¦˜μ΄ ν•„μš”ν•˜λ©°, μ΄λŸ¬ν•œ 트리 ν™•μž₯ μ „λž΅μ˜ μ΅œμ ν™”λŠ” ν–₯ν›„ 연ꡬ κ³Όμ œμž…λ‹ˆλ‹€.
πŸ‘