Sign In

LiTS: A Modular Framework for LLM Tree Search

Created by
  • Haebom
Category
Empty

μ €μž

Xinzhe Li, Yaguang Tao

πŸ’‘ κ°œμš”

λ³Έ 논문은 LLM 좔둠을 μœ„ν•œ λͺ¨λ“ˆν˜• 트리 탐색 ν”„λ ˆμž„μ›Œν¬μΈ LiTSλ₯Ό μ œμ•ˆν•œλ‹€. LiTSλŠ” 트리 탐색을 Policy, Transition, RewardModel의 μ„Έ κ°€μ§€ μž¬μ‚¬μš© κ°€λŠ₯ν•œ ꡬ성 μš”μ†Œλ‘œ λΆ„ν•΄ν•˜μ—¬ MCTS, BFS와 같은 μ•Œκ³ λ¦¬μ¦˜μ— ν†΅ν•©ν•œλ‹€. 이λ₯Ό 톡해 도메인 전문가와 μ•Œκ³ λ¦¬μ¦˜ μ—°κ΅¬μžκ°€ 각자의 전문성을 ν™œμš©ν•˜μ—¬ μƒˆλ‘œμš΄ 도메인 ν™•μž₯ 및 λ§žμΆ€ν˜• 탐색 μ•Œκ³ λ¦¬μ¦˜ κ΅¬ν˜„μ„ μš©μ΄ν•˜κ²Œ ν•œλ‹€. MATH500, Crosswords, MapEval 데이터셋에 λŒ€ν•œ μ‹€ν—˜ κ²°κ³Ό, μ œμ•ˆλœ ꡬ성 μš”μ†Œμ™€ μ•Œκ³ λ¦¬μ¦˜μ΄ μ„œλ‘œ λ…λ¦½μ μœΌλ‘œ μž‘λ™ν•¨μ„ μž…μ¦ν•˜μ—¬ λ²”μš©μ μΈ μž¬μ‚¬μš©μ„±μ„ 보여쀀닀.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM 좔둠을 μœ„ν•œ λͺ¨λ“ˆν™”λœ 트리 탐색 ν”„λ ˆμž„μ›Œν¬λŠ” λ‹€μ–‘ν•œ 도메인과 μ•Œκ³ λ¦¬μ¦˜μ— λŒ€ν•œ ν™•μž₯μ„±κ³Ό μž¬μ‚¬μš©μ„±μ„ 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆλ‹€.
β€’
λ¬΄ν•œν•œ μ•‘μ…˜ κ³΅κ°„μ—μ„œ LLM 기반 트리 νƒμƒ‰μ˜ νš¨κ³ΌλŠ” μ •μ±…μ˜ 닀양성에 달렀 있으며, 보상 λͺ¨λΈμ˜ ν’ˆμ§ˆλ³΄λ‹€ μ •μ±… 닀양성이 병λͺ© ν˜„μƒμ„ ν•΄μ†Œν•˜λŠ” 데 더 μ€‘μš”ν•˜λ‹€.
β€’
ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” 더 λ³΅μž‘ν•œ μΆ”λ‘  νƒœμŠ€ν¬μ— λŒ€ν•œ ν”„λ ˆμž„μ›Œν¬μ˜ 적용 κ°€λŠ₯성을 νƒμƒ‰ν•˜κ³ , LLM μ •μ±…μ˜ 닀양성을 높이기 μœ„ν•œ μƒˆλ‘œμš΄ 방법둠을 κ°œλ°œν•  ν•„μš”κ°€ μžˆλ‹€.
πŸ‘