Sign In

Personalizing LLMs with Binary Feedback: A Preference-Corrected Optimization Framework

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Xilai Ma, Liye Zhao, Weijun Yao, Haibing Di, Wenya Wang, Jing Li

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM) κ°œμΈν™”λ₯Ό μœ„ν•΄ μ‚¬μš©μž μ„ ν˜Έλ„μ— κΈ°λ°˜ν•œ 이진 ν”Όλ“œλ°±μ„ ν™œμš©ν•˜λŠ” C-BPO ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. C-BPOλŠ” νŠΉμ • μ‚¬μš©μžμ˜ 데이터λ₯Ό 긍정적 μ‹ ν˜Έλ‘œ, λ‹€λ₯Έ μ‚¬μš©μžμ˜ 데이터λ₯Ό 암묡적 λΆ€μ • μ‹ ν˜Έλ‘œ κ°„μ£Όν•˜μ—¬ μ‚¬μš©μž κ°„μ˜ 차이λ₯Ό 효과적으둜 ν¬μ°©ν•©λ‹ˆλ‹€. PU ν•™μŠ΅ 이둠에 κΈ°λ°˜ν•œ 객관 ν•¨μˆ˜λ₯Ό 톡해 μž‘μ—… κ΄€λ ¨ 지식이 잘λͺ» νŽ˜λ„ν‹°λ₯Ό λ°›λŠ” 것을 λ°©μ§€ν•˜λ©°, 독창적인 νŠΉμ„±μ„ μœ μ§€ν•˜λ©΄μ„œλ„ μ „λ°˜μ μΈ μœ μš©μ„±μ„ ν•΄μΉ˜μ§€ μ•ŠλŠ” κ°œμΈν™”λ₯Ό λ‹¬μ„±ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ‚¬μš©μž κ°„μ˜ 차이λ₯Ό κ³ λ €ν•œ LLM κ°œμΈν™”μ˜ μ€‘μš”μ„±μ„ κ°•μ‘°ν•˜κ³ , 이λ₯Ό 효과적으둜 λͺ¨λΈλ§ν•˜λŠ” C-BPO ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€.
β€’
PU ν•™μŠ΅ 이둠을 μ μš©ν•˜μ—¬ 잘λͺ»λœ λΆ€μ • μ‹ ν˜Έλ₯Ό μ •μ œν•¨μœΌλ‘œμ¨, κ°œμΈν™” κ³Όμ •μ—μ„œ 일반적인 μ„±λŠ₯ μ €ν•˜λ₯Ό μ΅œμ†Œν™”ν•˜λŠ” 방법을 μ œμ•ˆν•©λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ κ°œμΈν™” μž‘μ—… 및 LLMμ—μ„œ κΈ°μ‘΄ 방법둠 λŒ€λΉ„ μš°μˆ˜ν•œ μ„±λŠ₯을 μž…μ¦ν•˜λ©°, 이진 ν”Όλ“œλ°± 기반 κ°œμΈν™”μ˜ μ‹€νš¨μ„±μ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
(ν•œκ³„μ  λ˜λŠ” ν–₯ν›„ 과제) μ‹€μ œ ν™˜κ²½μ—μ„œμ˜ 적용 μ‹œ λ°œμƒν•  수 μžˆλŠ” 데이터 편ν–₯ λ¬Έμ œλ‚˜, 'λ‹€λ₯Έ μ‚¬μš©μž' λ°μ΄ν„°μ˜ λΆ€μ • μ‹ ν˜Έλ‘œμ„œμ˜ μ μ ˆμ„±μ— λŒ€ν•œ 좔가적인 검증 및 κ°œμ„  연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘