Sign In

Thinking Before Constraining: A Unified Decoding Framework for Large Language Models

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Ngoc Trinh Hung Nguyen, Alonso Silva, Laith Zumot, Liubov Tupikina, Armen Aghasaryan, Mehwish Alam

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 자유둜운 ν˜•μ‹ 응닡 생성 μ‹œ λ°œμƒν•˜λŠ” κ²€μ¦μ˜ 어렀움과, μ œμ•½ 쑰건이 이λ₯Έ μ‹œμ μ— μ μš©λ˜μ–΄ μΆ”λ‘  λŠ₯λ ₯을 μ œν•œν•˜λŠ” 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ μƒˆλ‘œμš΄ 톡합 λ””μ½”λ”© ν”„λ ˆμž„μ›Œν¬μΈ 'In-Writing'을 μ œμ•ˆν•©λ‹ˆλ‹€. In-Writing은 λ¨Όμ € 자유둜운 ν˜•μ‹μœΌλ‘œ 좔둠을 μˆ˜ν–‰ν•œ ν›„, νŠΉμ • 트리거 토큰이 생성될 λ•Œ λΉ„λ‘œμ†Œ κ΅¬μ‘°ν™”λœ 디코딩을 μ μš©ν•˜μ—¬ μΆ”λ‘ κ³Ό ν˜•μ‹ν™”λ₯Ό λͺ…ν™•νžˆ λΆ„λ¦¬ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 μ‘°κΈ° νŠΈλ¦¬κ±°λ§μ„ 효과적으둜 λ°©μ§€ν•˜λ©°, λΆ„λ₯˜ 및 μΆ”λ‘  μž‘μ—…μ—μ„œ κΈ°μ‘΄ μ΅œμ²¨λ‹¨ 방법 λŒ€λΉ„ μ΅œλŒ€ 27%의 정확도 ν–₯상을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLMμ—μ„œ 자유둜운 μΆ”λ‘ κ³Ό κ΅¬μ‘°ν™”λœ κ²°κ³Ό 생성을 효과적으둜 ν†΅ν•©ν•˜λŠ” ν•˜μ΄λΈŒλ¦¬λ“œ λ””μ½”λ”© ν”„λ ˆμž„μ›Œν¬μ˜ κ°€λŠ₯성을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μΆ”λ‘  κ³Όμ •μ—μ„œ μ œμ•½ 쑰건을 μ μš©ν•˜λŠ” μ‹œμ μ„ μ‘°μ ˆν•¨μœΌλ‘œμ¨, LLM의 μΆ”λ‘  λŠ₯λ ₯을 λ³΄μ‘΄ν•˜λ©΄μ„œλ„ 검증 κ°€λŠ₯ν•œ 좜λ ₯을 얻을 수 μžˆλŠ” μƒˆλ‘œμš΄ λ°©ν–₯을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
트리거 토큰 μ „λž΅μ˜ 섀계 및 적용이 λͺ¨λΈμ˜ μ„±λŠ₯에 λ―ΈμΉ˜λŠ” 영ν–₯에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•˜λ©°, λ‹€μ–‘ν•œ μž‘μ—…κ³Ό LLM μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ μΌλ°˜ν™” κ°€λŠ₯성을 검증해야 ν•©λ‹ˆλ‹€.
πŸ‘