Sign In

Draft-Thinking: Learning Efficient Reasoning in Long Chain-of-Thought LLMs

Created by
  • Haebom
Category
Empty

μ €μž

Jie Cao, Tianwei Lin, Zhenxuan Fan, Bo Yuan, Ziyuan Zhao, Rolan Yan, Wenqiao Zhang, Siliang Tang

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 μž₯문의 연쇄적 사고(CoT) 방식이 μƒλ‹Ήν•œ μ—°μ‚° λΉ„μš© 증가λ₯Ό λ™λ°˜ν•˜λ©°, λΆˆν•„μš”ν•œ "κ³Όμž‰ 사고"λ₯Ό μœ λ°œν•œλ‹€λŠ” λ¬Έμ œμ μ„ μ§€μ ν•©λ‹ˆλ‹€. 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, 연ꡬ진은 핡심 μΆ”λ‘  λ‹¨κ³„λ§Œ ν¬ν•¨ν•˜λŠ” κ°„κ²°ν•œ "μ΄ˆμ•ˆ μŠ€νƒ€μΌ"의 μΆ”λ‘  ꡬ쑰λ₯Ό ν•™μŠ΅ν•˜λ„λ‘ μœ λ„ν•˜λŠ” Draft-Thinking 방법둠을 μ œμ•ˆν•©λ‹ˆλ‹€. 이 방법둠은 점진적 컀리큘럼 ν•™μŠ΅κ³Ό μ μ‘ν˜• ν”„λ‘¬ν”„νŒ…μ„ 톡해 효율적인 μΆ”λ‘  νŒ¨ν„΄μ„ λ‚΄μž¬ν™”ν•˜κ³ , μ—°μ‚° λΉ„μš©μ„ 크게 μ€„μ΄λ©΄μ„œλ„ μ„±λŠ₯ μ €ν•˜λ₯Ό μ΅œμ†Œν™”ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM의 μ—°μ‚° νš¨μœ¨μ„±μ„ κ°œμ„ ν•˜μ—¬ μΆ”λ‘  λΉ„μš©μ„ μ ˆκ°ν•˜κ³ , μ„±λŠ₯ μ €ν•˜λ₯Ό μ΅œμ†Œν™”ν•˜λŠ” μ‹€μš©μ μΈ λ°©μ•ˆμ„ μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ΄ˆμ•ˆ μŠ€νƒ€μΌμ˜ μΆ”λ‘  ꡬ쑰λ₯Ό ν•™μŠ΅ν•¨μœΌλ‘œμ¨ LLM이 λΆˆν•„μš”ν•œ 사고 과정을 쀄이고 핡심 논리에 μ§‘μ€‘ν•˜λ„λ‘ μœ λ„ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ μ‘ν˜• ν”„λ‘¬ν”„νŒ…μ„ 톡해 λͺ¨λΈμ΄ ν•„μš”μ— 따라 μΆ”λ‘  깊이λ₯Ό μœ μ—°ν•˜κ²Œ μ‘°μ ˆν•˜λ„λ‘ ν•˜λŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ λ°©λ²•λ‘ μ˜ μΌλ°˜ν™” κ°€λŠ₯μ„±κ³Ό λ‹€μ–‘ν•œ LLM μ•„ν‚€ν…μ²˜ 및 μž‘μ—…μ— λŒ€ν•œ 효과 검증이 μΆ”κ°€μ μœΌλ‘œ ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘