Sign In

A Geometric Taxonomy of Hallucinations in LLMs

Created by
  • Haebom
Category
Empty

μ €μž

Javier Marin

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 ν™˜κ° ν˜„μƒμ„ μž„λ² λ”© κ³΅κ°„μ—μ„œμ˜ κΈ°ν•˜ν•™μ  νŠΉμ§•μ— κΈ°λ°˜ν•˜μ—¬ μ„Έ κ°€μ§€ μœ ν˜•(λ¬Έλ§₯ λΆˆμΆ©μ‹€, ν—ˆκ΅¬, 사싀 였λ₯˜)으둜 λΆ„λ₯˜ν•˜λŠ” μƒˆλ‘œμš΄ λΆ„λ₯˜ 체계λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. LLM이 μƒμ„±ν•œ ν™˜κ°μ€ μ˜μ—­μ— κ΅­ν•œλœ 탐지 μ„±λŠ₯을 λ³΄μ΄λŠ” 반면, 인간이 λ§Œλ“  ν—ˆκ΅¬λŠ” μ˜μ—­ κ°„ μΌκ΄€λœ 탐지 μ„±λŠ₯을 λ‚˜νƒ€λ‚΄λŠ” λΉ„λŒ€μΉ­μ„±μ„ κ΄€μ°°ν–ˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ κΈ°ν•˜ν•™μ  ꡬ쑰의 μ°¨μ΄λŠ” ν™˜κ°μ˜ 근본적인 ν˜„μƒ μ°¨μ΄μ—μ„œ λΉ„λ‘―λœλ‹€κ³  ν•΄μ„ν•˜λ©°, μž„λ² λ”© 기반 탐지가 λ¬Έλ§₯ λΆˆμΆ©μ‹€κ³Ό ν—ˆκ΅¬ μœ ν˜•μ—λŠ” νš¨κ³Όμ μ΄μ§€λ§Œ 사싀 였λ₯˜ μœ ν˜•μ—λŠ” μ™ΈλΆ€ 검증이 ν•„μš”ν•¨μ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM ν™˜κ° ν˜„μƒμ„ μž„λ² λ”© κ³΅κ°„μ˜ κΈ°ν•˜ν•™μ  νŠΉμ§•μ„ 톡해 λͺ…ν™•νžˆ κ΅¬λΆ„ν•˜κ³  λΆ„λ₯˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
LLM이 μƒμ„±ν•œ ν™˜κ°κ³Ό 인간이 μ˜λ„μ μœΌλ‘œ λ§Œλ“  ν—ˆκ΅¬λŠ” μ„œλ‘œ λ‹€λ₯Έ κΈ°ν•˜ν•™μ  ꡬ쑰λ₯Ό κ°€μ§€λ©°, μ΄λŠ” 탐지 μ „λž΅ μˆ˜λ¦½μ— μ€‘μš”ν•œ λ‹¨μ„œλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
사싀 였λ₯˜(Type III)λŠ” μž„λ² λ”© κ³΅κ°„μ˜ μ •λ³΄λ§ŒμœΌλ‘œλŠ” 탐지가 λΆˆκ°€λŠ₯ν•˜λ©°, μ™ΈλΆ€μ˜ 사싀 검증 λ©”μ»€λ‹ˆμ¦˜μ΄ ν•„μˆ˜μ μž„μ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μž„λ² λ”©μ€ μ™ΈλΆ€ μ„Έκ³„μ™€μ˜ μ‹€μ œ λŒ€μ‘ κ΄€κ³„λ³΄λ‹€λŠ” λΆ„ν¬μƒμ˜ λ™μ‹œ λ°œμƒμ„ λ°˜μ˜ν•˜λ―€λ‘œ, μ§„μ‹€μ„± 검증에 근본적인 ν•œκ³„κ°€ μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘