Sign In

Rescaling Confidence: What Scale Design Reveals About LLM Metacognition

Created by
  • Haebom
Category
Empty

μ €μž

Yuyang Dai

πŸ’‘ κ°œμš”

이 μ—°κ΅¬λŠ” λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)이 μžμ‹ μ˜ 응닡에 λŒ€ν•΄ λ³΄κ³ ν•˜λŠ” 수치적 확신도(verbalized confidence)의 척도 λ””μžμΈμ΄ λͺ¨λΈμ˜ λΆˆν™•μ‹€μ„± μΆ”μ • λŠ₯λ ₯에 λ―ΈμΉ˜λŠ” 영ν–₯을 μ‘°μ‚¬ν•©λ‹ˆλ‹€. 연ꡬ진은 μ²™λ„μ˜ μ„ΈλΆ„μ„±, 경계값 μ„€μ •, λ²”μœ„ κ·œμΉ™μ„± 등을 μ‘°μž‘ν•˜μ—¬ 메타인지 민감도λ₯Ό ν‰κ°€ν–ˆμœΌλ©°, 0-20 척도가 0-100 척도보닀 메타인지 νš¨μœ¨μ„±μ„ μΌκ΄€λ˜κ²Œ ν–₯μƒμ‹œν‚¨λ‹€λŠ” 사싀을 λ°œκ²¬ν–ˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” 확신도 척도 λ””μžμΈμ΄ LLM의 λΆˆν™•μ‹€μ„± μΆ”μ • ν’ˆμ§ˆμ— 직접적인 영ν–₯을 λ―ΈμΉ˜λ―€λ‘œ, LLM ν‰κ°€μ—μ„œ μ€‘μš”ν•œ μ‹€ν—˜ λ³€μˆ˜λ‘œ κ³ λ €λ˜μ–΄μ•Ό 함을 μ‹œμ‚¬ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM의 확신도 척도 λ””μžμΈμ€ λͺ¨λΈμ˜ 메타인지 λŠ₯λ ₯, 즉 λΆˆν™•μ‹€μ„±μ„ μ–Όλ§ˆλ‚˜ 잘 μΆ”μ •ν•˜λŠ”μ§€μ— 직접적인 영ν–₯을 λ―ΈμΉ©λ‹ˆλ‹€.
β€’
0-20κ³Ό 같이 더 μ„ΈλΆ„ν™”λ˜κ³  κ°„κ²°ν•œ 확신도 척도가 0-100κ³Ό 같은 전톡적인 척도보닀 LLM의 메타인지 νš¨μœ¨μ„±μ„ ν–₯μƒμ‹œν‚€λŠ” 데 더 효과적일 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ²™λ„μ˜ 경계값 압좕은 메타인지 μ„±λŠ₯을 μ €ν•˜μ‹œν‚€λ©°, λ‘₯κ·Ό μˆ«μžμ— λŒ€ν•œ LLM의 μ„ ν˜Έλ„λŠ” 척도 λ””μžμΈμ΄ λΆˆκ·œμΉ™ν•˜λ”λΌλ„ μ§€μ†λ˜λŠ” κ²½ν–₯이 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘