Sign In

Quantifying and Mitigating Self-Preference Bias of LLM Judges

Created by
  • Haebom
Category
Empty

μ €μž

Jinming Yang, Chuxian Qiu, Zhenyu Deng, Xinshan Jiao, Tao Zhou

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)이 자체 생성 결과물을 편ν–₯적으둜 ν‰κ°€ν•˜λŠ” '자체 μ„ ν˜Έλ„ 편ν–₯(SPB)' 문제λ₯Ό λ‹€λ£Ήλ‹ˆλ‹€. κΈ°μ‘΄ 평가 λ°©λ²•μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄, μ €μžλ“€μ€ μΈκ°„μ˜ κ°œμž… 없이 μžλ™μœΌλ‘œ SPBλ₯Ό μΈ‘μ •ν•˜κ³  μ™„ν™”ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 이 μ—°κ΅¬λŠ” LLM의 κ³ κΈ‰ κΈ°λŠ₯κ³Ό SPBκ°€ λ°˜λ“œμ‹œ 상관관계가 μ—†μŒμ„ 보여주며, 인지 λΆ€ν•˜ 뢄해에 κΈ°λ°˜ν•œ 닀차원 평가 μ „λž΅μ„ 톡해 SPBλ₯Ό 평균 31.5% κ°μ†Œμ‹œμΌ°μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM 기반 평가 μ‹œμŠ€ν…œμ˜ 신뒰성을 높이기 μœ„ν•΄ 자체 μ„ ν˜Έλ„ 편ν–₯(SPB)을 μ •λŸ‰ν™”ν•˜κ³  μ™„ν™”ν•˜λŠ” 것이 ν•„μˆ˜μ μž…λ‹ˆλ‹€.
β€’
μΈκ°„μ˜ κ°œμž… 없이도 SPBλ₯Ό μžλ™μœΌλ‘œ μΈ‘μ •ν•˜κ³  μ™„ν™”ν•  수 μžˆλŠ” μ‹€μš©μ μΈ 방법둠이 μ œμ‹œλ˜μ—ˆμŠ΅λ‹ˆλ‹€.
β€’
LLM의 μ„±λŠ₯ ν–₯상이 λ°˜λ“œμ‹œ SPB κ°μ†Œλ‘œ μ΄μ–΄μ§€λŠ” 것은 μ•„λ‹ˆλ©°, 편ν–₯ μ™„ν™”λ₯Ό μœ„ν•œ λ³„λ„μ˜ λ…Έλ ₯이 ν•„μš”ν•¨μ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ 닀차원 평가 μ „λž΅μ˜ μΌλ°˜ν™” κ°€λŠ₯μ„± 및 λ‹€μ–‘ν•œ LLM μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ 효과 검증이 ν–₯ν›„ 과제둜 λ‚¨μ•„μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘