Sign In

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Created by
  • Haebom
Category
Empty

μ €μž

Long Zhang, Wei-neng Chen, Feng-feng Wei, Zi-bo Qin

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ–Έμ–΄ λͺ¨λΈμ΄ μ΅œμ’… 닡변을 μƒμ„±ν•˜κΈ° μ „, μ–Έμ œ λ‹΅λ³€ μ„ ν˜Έλ„κ°€ μ•ˆμ •ν™”λ˜λŠ”μ§€λ₯Ό μœ ν•œν•œ λ‹΅λ³€ 집합에 λŒ€ν•œ λͺ¨λΈμ˜ ν™•λ₯  뢄포λ₯Ό νˆ¬μ˜ν•˜λŠ” 'μœ ν•œ λ‹΅λ³€ μ„ ν˜Έλ„ μ•ˆμ •ν™”'λΌλŠ” κ°œλ…μ„ 톡해 λΆ„μ„ν•©λ‹ˆλ‹€. μ œμ•ˆλœ 방법둠은 νŒŒμ„œ 기반의 λ‹΅λ³€ μ‹œμž‘ μ‹œμ , 회고적 μ•ˆμ •ν™” μ‹œκ°„, 그리고 선도 μ‹œκ°„μ„ νƒμƒ‰ν•˜λ©°, ν›ˆλ ¨λœ νƒμƒ‰μ΄λ‚˜ ν•™μŠ΅λœ 탐침 없이 μž‘λ™ν•©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, Qwen3-4B-Instruct λͺ¨λΈμ€ 닡변이 νŒŒμ‹± κ°€λŠ₯ν•΄μ§€κΈ° 전에 μ„ ν˜Έλ„ μ•ˆμ •ν™”κ°€ 이루어지며, μ΄λŠ” λͺ¨λΈμ˜ μ΅œμ’… 좜λ ₯κ³Ό 상관관계가 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ–Έμ–΄ λͺ¨λΈμ˜ μΆ”λ‘  κ³Όμ •μ—μ„œ λ‹΅λ³€ μ„ ν˜Έλ„κ°€ μ–Έμ œ ν˜•μ„±λ˜λŠ”μ§€μ— λŒ€ν•œ μ •λŸ‰μ μΈ μΈ‘μ • 기쀀을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
λͺ¨λΈμ˜ λ‚΄λΆ€ μƒνƒœμ™€ μ΅œμ’… λ‹΅λ³€ κ°„μ˜ 관계λ₯Ό μ΄ν•΄ν•˜κ³ , λͺ¨λΈμ˜ λ™μž‘μ„ λΆ„μ„ν•˜λŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ μΈ‘μ • 방식이 λͺ¨λΈμ˜ μ‹€μ œ 좜λ ₯λ§Œμ„ μΆ”μ ν•˜λ©°, μ§„μ‹€ μ—¬λΆ€μ™€λŠ” λ³„κ°œλ‘œ μž‘λ™ν•œλ‹€λŠ” 점은 해석에 μœ μ˜ν•΄μ•Ό ν•©λ‹ˆλ‹€.
β€’
μ •ν™•ν•œ μ œμ–΄μ™€ 달리, κ΅­μ†Œμ μΈ λ―Όκ°λ„λ§Œ 확인할 수 μžˆμ–΄ μ•ˆμ •μ μΈ 생성 μ œμ–΄μ—λŠ” ν•œκ³„κ°€ μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘