Sign In

TokUR: Token-Level Uncertainty Estimation for Large Language Model Reasoning

Created by
  • Haebom
Category
Empty

μ €μž

Tunyu Zhang, Haizhou Shi, Yibin Wang, Hengyi Wang, Xiaoxiao He, Zhuowei Li, Haoxian Chen, Ligong Han, Kai Xu, Huan Zhang, Dimitris Metaxas, Hao Wang

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 μΆ”λ‘  κ³Όμ •μ—μ„œ λ‹΅λ³€μ˜ 신뒰성을 ν‰κ°€ν•˜κ³  κ°œμ„ ν•˜κΈ° μœ„ν•œ "TokUR"μ΄λΌλŠ” 토큰 μˆ˜μ€€ λΆˆν™•μ‹€μ„± μΆ”μ • ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•œλ‹€. LLM λ””μ½”λ”© 과정에 μ €λž­ν¬ 랜덀 κ°€μ€‘μΉ˜ 섭동을 λ„μž…ν•˜μ—¬ 토큰 μˆ˜μ€€μ˜ λΆˆν™•μ‹€μ„±μ„ μΈ‘μ •ν•˜κ³ , 이λ₯Ό μ§‘κ³„ν•˜μ—¬ μ‘λ‹΅μ˜ 의미둠적 λΆˆν™•μ‹€μ„±μ„ νŒŒμ•…ν•œλ‹€. μ‹€ν—˜ κ²°κ³Ό, TokURλŠ” μ •λ‹΅μ˜ μ •ν™•μ„± 및 λͺ¨λΈ 견고성과 높은 상관관계λ₯Ό 보이며, 이λ₯Ό ν™œμš©ν•˜μ—¬ λͺ¨λΈμ˜ μΆ”λ‘  μ„±λŠ₯을 ν–₯μƒμ‹œν‚¬ 수 μžˆμŒμ„ μž…μ¦ν•˜μ˜€λ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM의 λ³΅μž‘ν•œ 닀단계 μΆ”λ‘  κ³Όμ •μ—μ„œ μƒμ„±λœ μ‘λ‹΅μ˜ 신뒰성을 κ°κ΄€μ μœΌλ‘œ 평가할 수 μžˆλŠ” 방법둠을 μ œμ‹œν•˜μ˜€λ‹€.
β€’
μƒμ„±λœ λΆˆν™•μ‹€μ„± μ‹ ν˜ΈλŠ” ν…ŒμŠ€νŠΈ μ‹œμ μ—μ„œ λͺ¨λΈμ˜ μΆ”λ‘  μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” 데 효과적으둜 ν™œμš©λ  수 μžˆλ‹€.
β€’
μ œμ•ˆλœ 방법둠은 μˆ˜ν•™μ  μΆ”λ‘ κ³Ό 같이 정닡이 λͺ…ν™•ν•œ λΆ„μ•Όμ—μ„œ LLM의 μ‹ λ’°μ„±κ³Ό 해석 κ°€λŠ₯성을 λ†’μ΄λŠ” 데 κΈ°μ—¬ν•  수 μžˆλ‹€.
β€’
ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” 더 λ‹€μ–‘ν•œ μ’…λ₯˜μ˜ μΆ”λ‘  μž‘μ—… 및 LLM μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ TokUR의 μΌλ°˜ν™” κ°€λŠ₯성을 탐색해야 ν•œλ‹€.
πŸ‘