haebom
Sign In
Draft-Thinking: Learning Efficient Reasoning in Long Chain-of-Thought LLMs
Created by
Haebom
Category
Empty
μ μ
Jie Cao, Tianwei Lin, Zhenxuan Fan, Bo Yuan, Ziyuan Zhao, Rolan Yan, Wenqiao Zhang, Siliang Tang
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ μ₯λ¬Έμ μ°μμ μ¬κ³ (CoT) λ°©μμ΄ μλΉν μ°μ° λΉμ© μ¦κ°λ₯Ό λλ°νλ©°, λΆνμν "κ³Όμ μ¬κ³ "λ₯Ό μ λ°νλ€λ λ¬Έμ μ μ μ§μ ν©λλ€. μ΄λ₯Ό ν΄κ²°νκΈ° μν΄, μ°κ΅¬μ§μ ν΅μ¬ μΆλ‘ λ¨κ³λ§ ν¬ν¨νλ κ°κ²°ν "μ΄μ μ€νμΌ"μ μΆλ‘ ꡬ쑰λ₯Ό νμ΅νλλ‘ μ λνλ Draft-Thinking λ°©λ²λ‘ μ μ μν©λλ€. μ΄ λ°©λ²λ‘ μ μ μ§μ 컀리νλΌ νμ΅κ³Ό μ μν ν둬νν μ ν΅ν΄ ν¨μ¨μ μΈ μΆλ‘ ν¨ν΄μ λ΄μ¬ννκ³ , μ°μ° λΉμ©μ ν¬κ² μ€μ΄λ©΄μλ μ±λ₯ μ νλ₯Ό μ΅μνν©λλ€.
π μμ¬μ λ° νκ³
β’
LLMμ μ°μ° ν¨μ¨μ±μ κ°μ νμ¬ μΆλ‘ λΉμ©μ μ κ°νκ³ , μ±λ₯ μ νλ₯Ό μ΅μννλ μ€μ©μ μΈ λ°©μμ μ μν©λλ€.
β’
μ΄μ μ€νμΌμ μΆλ‘ ꡬ쑰λ₯Ό νμ΅ν¨μΌλ‘μ¨ LLMμ΄ λΆνμν μ¬κ³ κ³Όμ μ μ€μ΄κ³ ν΅μ¬ λ Όλ¦¬μ μ§μ€νλλ‘ μ λν μ μμ΅λλ€.
β’
μ μν ν둬νν μ ν΅ν΄ λͺ¨λΈμ΄ νμμ λ°λΌ μΆλ‘ κΉμ΄λ₯Ό μ μ°νκ² μ‘°μ νλλ‘ νλ μλ‘μ΄ μ κ·Ό λ°©μμ μ μν©λλ€.
β’
μ μλ λ°©λ²λ‘ μ μΌλ°ν κ°λ₯μ±κ³Ό λ€μν LLM μν€ν μ² λ° μμ μ λν ν¨κ³Ό κ²μ¦μ΄ μΆκ°μ μΌλ‘ νμν©λλ€.
PDF 보기
Made with Slashpage