Sign In

LLM-FSM: Scaling Large Language Models for Finite-State Reasoning in RTL Code Generation

Created by
  • Haebom
Category
Empty

μ €μž

Yuheng Wu, Berk Gokmen, Zhouhua Xie, Peijing Li, Caroline Trippel, Priyanka Raina, Thierry Tambe

πŸ’‘ κ°œμš”

λ³Έ 논문은 ν•˜λ“œμ›¨μ–΄ 섀계λ₯Ό μœ„ν•œ 핡심 λŠ₯λ ₯인 μœ ν•œ μƒνƒœ 기계(FSM) 좔둠을 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)이 μ–Όλ§ˆλ‚˜ 잘 μˆ˜ν–‰ν•˜λŠ”μ§€ ν‰κ°€ν•˜λŠ” LLM-FSM 벀치마크λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. LLM-FSM은 μžμ—°μ–΄ λͺ…μ„Έλ‘œλΆ€ν„° FSM λ™μž‘μ„ λ³΅κ΅¬ν•˜κ³  이λ₯Ό μ˜¬λ°”λ₯Έ RTL κ΅¬ν˜„μœΌλ‘œ λ³€ν™˜ν•˜λŠ” LLM의 λŠ₯λ ₯을 μΈ‘μ •ν•˜λ©°, κΈ°μ‘΄ λ²€μΉ˜λ§ˆν¬μ™€ 달리 μžλ™ν™”λœ νŒŒμ΄ν”„λΌμΈμ„ 톡해 κ΅¬μΆ•λ©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, LLM은 FSM λ³΅μž‘μ„±μ΄ 증가함에 따라 정확도가 크게 κ°μ†Œν•˜λŠ” κ²½ν–₯을 λ³΄μ˜€μ§€λ§Œ, 지도 ν•™μŠ΅ νŒŒμΈνŠœλ‹(SFT)을 ν†΅ν•œ ν›ˆλ ¨ μ‹œκ°„ μŠ€μΌ€μΌλ§μ€ 뢄포 μ™Έ(OOD) μž‘μ—…μ— 효과적으둜 μΌλ°˜ν™”λ¨μ„ λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM이 μžμ—°μ–΄ λͺ…μ„Έλ‘œλΆ€ν„° λ³΅μž‘ν•œ ν•˜λ“œμ›¨μ–΄ λ™μž‘(FSM)을 μ΄ν•΄ν•˜κ³  RTL μ½”λ“œλ‘œ μƒμ„±ν•˜λŠ” 데 μžˆμ–΄, FSM λ³΅μž‘μ„± 증가에 따라 μ„±λŠ₯이 μ €ν•˜λœλ‹€λŠ” 점을 λͺ…ν™•νžˆ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
지도 ν•™μŠ΅ νŒŒμΈνŠœλ‹(SFT)이 LLM의 뢄포 μ™Έ(OOD) μž‘μ—…μ— λŒ€ν•œ μΌλ°˜ν™” μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” 효과적인 λ°©λ²•μž„μ„ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
LLM-FSM λ²€μΉ˜λ§ˆν¬λŠ” ν–₯ν›„ LLM의 FSM λ³΅μž‘μ„± 처리 λŠ₯λ ₯이 λ°œμ „ν•¨μ— 따라 μ§€μ†μ μœΌλ‘œ ν™•μž₯될 수 μžˆμ–΄, LLM의 ν•˜λ“œμ›¨μ–΄ 섀계 λΆ„μ•Ό 적용 κ°€λŠ₯성을 νƒκ΅¬ν•˜λŠ” 데 μœ μš©ν•œ λ„κ΅¬λ‘œ ν™œμš©λ  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
ν˜„μž¬ LLM은 κ³ λ„λ‘œ λ³΅μž‘ν•˜κ±°λ‚˜ νŠΉμ •ν•œ ꡬ쑰의 FSM에 λŒ€ν•΄μ„œλŠ” μ—¬μ „νžˆ μ œν•œμ μΈ μ„±λŠ₯을 보이며, μΆ”λ‘  신뒰성을 λ”μš± 높이기 μœ„ν•œ 좔가적인 연ꡬ 및 λͺ¨λΈ κ°œμ„ μ΄ ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘