Sign In

The Illusion of Insight in Reasoning Models

Created by
  • Haebom
Category
Empty

μ €μž

Liv G. d'Aliberti, Manoel Horta Ribeiro

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” μΆ”λ‘  λͺ¨λΈμ΄ "μ•„ν•˜!" μˆœκ°„κ³Ό 같은 λ‚΄μž¬μ μΈ 톡찰λ ₯으둜 슀슀둜λ₯Ό μˆ˜μ •ν•˜λŠ”μ§€μ— λŒ€ν•œ μ˜λ¬Έμ„ μ œκΈ°ν•©λ‹ˆλ‹€. 1백만 개 μ΄μƒμ˜ μΆ”λ‘  κ³Όμ • 뢄석을 톡해, μΆ”λ‘  κ³Όμ • 쀑 λ°œμƒν•˜λŠ” 톡찰(shift)은 λ“œλ¬Όκ³  ν›ˆλ ¨ν•΄λ„ λΉˆλ„κ°€ μ¦κ°€ν•˜μ§€ μ•ŠμœΌλ©° μ„±λŠ₯ ν–₯상에 거의 κΈ°μ—¬ν•˜μ§€ μ•ŠμŒμ„ λ°œκ²¬ν–ˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ˜ λ‚΄μž¬μ μΈ 자기 μˆ˜μ • λŠ₯λ ₯에 λŒ€ν•œ 기쑴의 인식을 μž¬κ³ ν•˜κ²Œ λ§Œλ“­λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μΆ”λ‘  λͺ¨λΈμ˜ "톡찰" λ˜λŠ” "μ•„ν•˜!" μˆœκ°„μ€ μ‹€μ œλ‘œλŠ” λΆˆμ•ˆμ •ν•œ μΆ”λ‘  ν–‰λ™μ˜ 뢀산물일 뿐, λ‚΄μž¬μ μΈ 자기 μˆ˜μ • λ©”μ»€λ‹ˆμ¦˜μ΄ μ•„λ‹˜μ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€.
β€’
λͺ¨λΈμ˜ λΆˆν™•μ‹€μ„±(entropy)κ³Ό ν†΅μ°°μ˜ λ°œμƒ 및 영ν–₯ κ°„μ˜ 관계λ₯Ό 밝히고, 높은 λΆˆν™•μ‹€μ„± ν•˜μ—μ„œ 외뢀적인 톡찰을 μΈμœ„μ μœΌλ‘œ μœ λ°œν•˜λŠ” 것이 μ„±λŠ₯을 ν–₯μƒμ‹œν‚¬ 수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬μ—μ„œ μ‚¬μš©λœ λͺ¨λΈ 및 λ°μ΄ν„°μ…‹μ˜ ν•œκ³„μ μ€ λ‹€λ₯Έ λͺ¨λΈ μ•„ν‚€ν…μ²˜λ‚˜ λ³΅μž‘ν•œ μΆ”λ‘  λ„λ©”μΈμœΌλ‘œ μΌλ°˜ν™”λ  λ•Œ 좔가적인 검증이 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘