Sign In

The System Hallucination Scale (SHS): A Minimal yet Effective Human-Centered Instrument for Evaluating Hallucination-Related Behavior in Large Language Models

Created by
  • Haebom
Category
Empty

μ €μž

Heimo Muller, Dominik Steiger, Markus Plass, Andreas Holzinger

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 ν™˜κ°(hallucination) κ΄€λ ¨ 행동을 ν‰κ°€ν•˜κΈ° μœ„ν•œ μƒˆλ‘­κ³  κ°„κ²°ν•˜λ©° μ‚¬μš©μž 쀑심적인 μΈ‘μ • 도ꡬ인 'μ‹œμŠ€ν…œ ν™˜κ° 척도(SHS)'λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. SHSλŠ” 사싀적 μ‹ λ’°μ„± λΆ€μ‘±, 비일관성, μ˜€ν•΄μ˜ μ†Œμ§€κ°€ μžˆλŠ” μ œμ‹œ, μ‚¬μš©μž 지침에 λŒ€ν•œ 응닡성 λ“± ν™˜κ° ν˜„μƒμ΄ μ‚¬μš©μž κ΄€μ μ—μ„œ μ–΄λ–»κ²Œ λ‚˜νƒ€λ‚˜λŠ”μ§€λ₯Ό μ‹€μ‹œκ°„ μƒν˜Έμž‘μš© μ‘°κ±΄μ—μ„œ ν¬μ°©ν•©λ‹ˆλ‹€. 210λͺ…μ˜ μ°Έκ°€μžλ₯Ό λŒ€μƒμœΌλ‘œ ν•œ μ‹€μ œ ν‰κ°€μ—μ„œ SHSλŠ” 높은 λͺ…ν™•μ„±, μΌκ΄€λœ 응닡 행동, 그리고 ν†΅κ³„μ μœΌλ‘œ μœ μ˜λ―Έν•œ ꡬ성 타당도λ₯Ό μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ‚¬μš©μž κ²½ν—˜ 쀑심 평가: SHSλŠ” LLM의 ν™˜κ°μ„ 기술적인 μ§€ν‘œκ°€ μ•„λ‹Œ, μ‹€μ œ μ‚¬μš©μžκ°€ κ²ͺλŠ” κ²½ν—˜μ˜ κ΄€μ μ—μ„œ 평가할 수 μžˆλŠ” κ°„νŽΈν•˜κ³  효과적인 방법을 μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
닀차원적이고 도메인 λΆˆκ°€μ§€μ  평가: 사싀성, 일관성, μ œμ‹œ 방식, μ‚¬μš©μž μ§€μΉ¨ λ°˜μ‘μ„± λ“± λ‹€μ–‘ν•œ ν™˜κ° ν˜„μƒμ„ ν¬κ΄„μ μœΌλ‘œ ν‰κ°€ν•˜λ©°, νŠΉμ • 도메인에 κ΅­ν•œλ˜μ§€ μ•Šμ•„ ν­λ„“κ²Œ 적용 κ°€λŠ₯ν•©λ‹ˆλ‹€.
β€’
κΈ°μ‘΄ μ²™λ„μ™€μ˜ 보완성: SUS 및 SCS와 같은 κΈ°μ‘΄ μ²™λ„μ™€μ˜ 비ꡐ 뢄석을 톡해 SHSκ°€ μƒν˜Έ 보완적인 μΈ‘μ • 속성을 κ°€μ§€λ©°, μ‹œμŠ€ν…œ 비ꡐ 뢄석, 개발 및 배포 λͺ¨λ‹ˆν„°λ§μ— μ‹€μ§ˆμ μœΌλ‘œ κΈ°μ—¬ν•  수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μžλ™ 감지 λ„κ΅¬μ˜ ν•œκ³„: SHSλŠ” μžλ™ν™”λœ ν™˜κ° νƒμ§€κΈ°λ‚˜ 벀치마크 μ§€ν‘œκ°€ μ•„λ‹ˆλ―€λ‘œ, 객관적인 ν™˜κ° λ°œμƒ λΉˆλ„ μΈ‘μ •μ—λŠ” ν•œκ³„κ°€ μžˆμ„ 수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘