Sign In

Time Series Reasoning via Process-Verifiable Thinking Data Synthesis and Scheduling for Tailored LLM Reasoning

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Jiahui Zhou, Dan Li, Boxin Li, Xiao Zhang, Erli Meng, Lin Li, Zhuomin Chen, Jian Lou, See-Kiong Ng

πŸ’‘ κ°œμš”

λ³Έ 논문은 λ‹€μ–‘ν•œ μ‘μš© λΆ„μ•Όμ—μ„œ μ€‘μš”ν•œ μ‹œκ³„μ—΄ λ°μ΄ν„°μ˜ 합리적인 문제 해결을 μœ„ν•΄ λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 μΆ”λ‘  λŠ₯λ ₯을 ν™œμš©ν•˜λŠ” 데 쀑점을 λ‘‘λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ λ…Όλ¬Έμ—μ„œλŠ” μ‹œκ³„μ—΄ 좔둠을 μœ„ν•œ LLM을 맞좀 μ œμž‘ν•˜λŠ” VeriTime ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. VeriTime은 κ³Όμ • 검증 κ°€λŠ₯ν•œ 주석을 ν¬ν•¨ν•œ μ‹œκ³„μ—΄-ν…μŠ€νŠΈ λ©€ν‹°λͺ¨λ‹¬ 데이터 ν•©μ„±, λ‚œμ΄λ„ 및 μž‘μ—… λΆ„λ₯˜ 체계에 λ”°λ₯Έ 데이터 μŠ€μΌ€μ€„λ§, 그리고 검증 κ°€λŠ₯ν•œ κ³Όμ • μˆ˜μ€€ CoT 데이터λ₯Ό ν™œμš©ν•˜λŠ” λ―Έμ„Έν•œ 닀쀑 λͺ©ν‘œ 보상을 νŠΉμ§•μœΌλ‘œ ν•˜λŠ” 2단계 κ°•ν™” λ―Έμ„Έ μ‘°μ •μœΌλ‘œ κ΅¬μ„±λ©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
VeriTime ν”„λ ˆμž„μ›Œν¬λŠ” μ‹œκ³„μ—΄ 좔둠을 μœ„ν•œ LLM의 μ„±λŠ₯을 크게 ν–₯μƒμ‹œν‚€λ©°, 특히 μ†Œν˜• λͺ¨λΈλ‘œλ„ λŒ€κ·œλͺ¨ 독점 LLM에 ν•„μ ν•˜κ±°λ‚˜ λŠ₯κ°€ν•˜λŠ” μΆ”λ‘  λŠ₯λ ₯을 달성할 수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
κ³Όμ • 검증 κ°€λŠ₯ν•œ 주석을 κ°–μΆ˜ μ‹œκ³„μ—΄-ν…μŠ€νŠΈ λ©€ν‹°λͺ¨λ‹¬ 데이터 ν•©μ„± 및 λ‚œμ΄λ„ 기반 데이터 μŠ€μΌ€μ€„λ§ λ©”μ»€λ‹ˆμ¦˜μ€ LLM의 데이터 νš¨μœ¨μ„±κ³Ό μΆ”λ‘  λŠ₯λ ₯을 ν–₯μƒμ‹œν‚€λŠ” 데 μ€‘μš”ν•œ 역할을 ν•©λ‹ˆλ‹€.
β€’
ν˜„μž¬ μ—°κ΅¬λŠ” μ‹œκ³„μ—΄ λ°μ΄ν„°μ˜ λ³΅μž‘μ„±κ³Ό 닀양성을 μ™„μ „νžˆ ν¬κ΄„ν•˜λŠ” 데 ν•œκ³„κ°€ μžˆμ„ 수 있으며, ν–₯ν›„ 더 λ‹€μ–‘ν•œ μ‹œκ³„μ—΄ μž‘μ—… 및 데이터 μœ ν˜•μ— λŒ€ν•œ 적용 κ°€λŠ₯성을 ν™•μž₯ν•˜κ³ , μ‹€μ‹œκ°„ μΆ”λ‘  및 더 λ³΅μž‘ν•œ μ‹œκ³„μ—΄ νŒ¨ν„΄μ— λŒ€ν•œ 처리λ₯Ό κ°œμ„ ν•˜λŠ” 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘