Sign In

When LLMs get significantly worse: A statistical approach to detect model degradations

Created by
  • Haebom
Category
Empty

μ €μž

Jonas Kubler, Kailash Budhathoki, Matthaus Kleindessner, Xiong Zhou, Junming Yin, Ashish Khetan, George Karypis

πŸ’‘ κ°œμš”

λ³Έ 논문은 κ±°λŒ€ μ–Έμ–΄ λͺ¨λΈ(LLM)의 μΆ”λ‘  λΉ„μš© 및 μ§€μ—° μ‹œκ°„ κ°μ†Œλ₯Ό μœ„ν•œ μ΅œμ ν™” κ³Όμ •μ—μ„œ λͺ¨λΈ ν’ˆμ§ˆ μ €ν•˜λ₯Ό νƒμ§€ν•˜λŠ” 톡계적 접근법을 μ œμ•ˆν•©λ‹ˆλ‹€. μ œμ•ˆλœ 방법둠은 McNemar 검정에 κΈ°λ°˜ν•œ κ°€μ„€ κ²€μ • ν”„λ ˆμž„μ›Œν¬λ₯Ό ν™œμš©ν•˜μ—¬, κ°œλ³„ μƒ˜ν”Œμ˜ λͺ¨λΈ 점수λ₯Ό λΉ„κ΅ν•¨μœΌλ‘œμ¨ μ‹€μ œ λͺ¨λΈ μ„±λŠ₯ μ €ν•˜λ₯Ό 효과적으둜 κ°μ§€ν•˜κ³  잘λͺ»λœ μ–‘μ„±(false positive)을 μ œμ–΄ν•©λ‹ˆλ‹€. 연ꡬ κ²°κ³Ό, 0.3% μˆ˜μ€€μ˜ λ―Έλ―Έν•œ 정확도 μ €ν•˜λ„ μ‹€μ œ λͺ¨λΈ μ„±λŠ₯ μ €ν•˜λ‘œ μžμ‹  있게 νŒλ³„ν•  수 μžˆμŒμ„ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM μ΅œμ ν™” μ‹œ λͺ¨λΈ μ„±λŠ₯ μ €ν•˜λ₯Ό ν†΅κ³„μ μœΌλ‘œ μœ μ˜λ―Έν•˜κ²Œ νƒμ§€ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
κ°œλ³„ μƒ˜ν”Œ λ‹¨μœ„μ˜ 비ꡐλ₯Ό 톡해 λ―Έμ„Έν•œ μ„±λŠ₯ μ €ν•˜λ„ 포착 κ°€λŠ₯함을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
이둠적으둜 무손싀 μ΅œμ ν™”κ°€ μ‹€μ œλ‘œ λͺ¨λΈ μ„±λŠ₯을 μ €ν•˜μ‹œν‚€λŠ”μ§€ μ—¬λΆ€λ₯Ό κ°κ΄€μ μœΌλ‘œ νŒλ‹¨ν•˜λŠ” 기쀀을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ 벀치마크의 κ²°κ³Όλ₯Ό 단일 κ²°μ •μœΌλ‘œ ν†΅ν•©ν•˜λŠ” 방법을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ 방법둠은 νŠΉμ • 톡계적 가정에 κΈ°λ°˜ν•˜λ―€λ‘œ, λ³΅μž‘ν•˜κ±°λ‚˜ λΉ„μ •ν˜•μ μΈ μ„±λŠ₯ λ³€ν™” νŒ¨ν„΄μ—λŠ” 적용이 μ œν•œλ  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘