Sign In

Probabilistic Tiny Recursive Model

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Amin Sghaier, Ali Parviz, Alexia Jolicoeur-Martineau

πŸ’‘ κ°œμš”

λ³Έ 논문은 κΈ°μ‘΄ Tiny Recursive Models(TRM)의 결정둠적 μž¬κ·€κ°€ μ΅œμ ν™”λ˜μ§€ μ•Šμ€ ν•΄λ‘œ μˆ˜λ ΄ν•˜λŠ” 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ ν™•λ₯ μ  탐색을 λ„μž…ν•œ Probabilistic TRM(PTRM)을 μ œμ•ˆν•©λ‹ˆλ‹€. PTRM은 각 μž¬κ·€ λ‹¨κ³„λ§ˆλ‹€ κ°€μš°μ‹œμ•ˆ λ…Έμ΄μ¦ˆλ₯Ό μ£Όμž…ν•˜μ—¬ λ³‘λ ¬μ μœΌλ‘œ λ‹€μ–‘ν•œ ν•΄ 탐색 곡간을 νƒν—˜ν•˜κ²Œ ν•˜κ³ , λͺ¨λΈμ˜ Q ν—€λ“œλ₯Ό μ΄μš©ν•΄ 졜적의 ν•΄λ₯Ό μ„ νƒν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 μž¬ν•™μŠ΅μ΄λ‚˜ νŠΉμ • μž‘μ—…μ— λŒ€ν•œ 데이터 증강 없이도 Sudoku-Extreme 및 Pencil Puzzle Bench λ“± λ‹€μ–‘ν•œ λ²€μΉ˜λ§ˆν¬μ—μ„œ μƒλ‹Ήν•œ 정확도 ν–₯상을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
TRM의 결정둠적 ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³  문제 ν•΄κ²° λŠ₯λ ₯을 κ°•ν™”ν•˜λŠ” μƒˆλ‘œμš΄ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€.
β€’
적은 νŒŒλΌλ―Έν„° 수(7M)λ‘œλ„ μ΅œμ²¨λ‹¨ LLM λŒ€λΉ„ μ›”λ“±ν•œ μ„±λŠ₯κ³Ό νš¨μœ¨μ„±μ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
ν…ŒμŠ€νŠΈ μ‹œμ  μ»΄ν“¨νŒ… μžμ› ν™•μž₯을 톡해 μ„±λŠ₯ ν–₯상을 μ΄λ£¨μ–΄λ‚΄λŠ” 효과적인 λ°©λ²•λ‘ μž…λ‹ˆλ‹€.
β€’
λ…Έμ΄μ¦ˆ μ£Όμž…λŸ‰ 및 Q ν—€λ“œλ₯Ό μ΄μš©ν•œ 선택 μ „λž΅ λ“± ν™•λ₯ μ  탐색 κ΄€λ ¨ ν•˜μ΄νΌνŒŒλΌλ―Έν„° νŠœλ‹μ΄ μΆ”κ°€μ μœΌλ‘œ ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘