Sign In

Constraining Sequential Model Editing with Editing Anchor Compression

Created by
  • Haebom
Category
Empty

μ €μž

Hao-Xiang Xu, Jun-Yu Ma, Zhen-Hua Ling, Ningyu Zhang, Jia-Chen Gu

πŸ’‘ κ°œμš”

λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)은 잘λͺ»λ˜κ±°λ‚˜ 였래된 μ§€μ‹μœΌλ‘œ μΈν•œ ν™˜κ°(hallucination) 문제λ₯Ό κ²ͺμŠ΅λ‹ˆλ‹€. λͺ¨λΈ μž¬ν•™μŠ΅μ˜ 높은 μžμ› μš”κ΅¬λŸ‰ λ•Œλ¬Έμ— λͺ¨λΈ νŽΈμ§‘μ— λŒ€ν•œ 연ꡬ가 μ€‘μš”ν•΄μ§€κ³  μžˆμœΌλ‚˜, 순차적인 λͺ¨λΈ νŽΈμ§‘μ€ LLM의 μ „λ°˜μ μΈ λŠ₯λ ₯ μ €ν•˜λ₯Ό μœ λ°œν•©λ‹ˆλ‹€. λ³Έ 논문은 νŽΈμ§‘ νšŸμˆ˜κ°€ λŠ˜μ–΄λ‚¨μ— 따라 νŒŒλΌλ―Έν„° ν–‰λ ¬μ˜ νŽΈμ°¨κ°€ 컀져 μ›λž˜ 지식 연관성을 ν›Όμ†ν•˜κ³  μ „λ°˜μ μΈ λŠ₯λ ₯을 μ €ν•˜μ‹œν‚¨λ‹€λŠ” 사싀을 ν†΅κ³„μ μœΌλ‘œ κ΄€μ°°ν•©λ‹ˆλ‹€. 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, μ œμ•ˆλœ Editing Anchor Compression (EAC) ν”„λ ˆμž„μ›Œν¬λŠ” μƒˆλ‘œμš΄ 관계λ₯Ό μΈμ½”λ”©ν•˜λŠ” 데 μ€‘μš”ν•˜λ©΄μ„œλ„ μ›λž˜ ν–‰λ ¬λ‘œλΆ€ν„° κ³Όλ„ν•˜κ²Œ λ²—μ–΄λ‚˜μ§€ μ•ŠλŠ” νŽΈμ§‘ 액컀λ₯Ό μ„ νƒν•˜μ—¬ νŽΈμ§‘ 정보λ₯Ό μ••μΆ•ν•¨μœΌλ‘œμ¨ 순차 νŽΈμ§‘ 쀑 νŒŒλΌλ―Έν„° ν–‰λ ¬μ˜ 편차λ₯Ό μ œμ–΄ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
순차적인 λͺ¨λΈ νŽΈμ§‘ μ‹œ λ°œμƒν•˜λŠ” νŒŒλΌλ―Έν„° ν–‰λ ¬μ˜ 편차λ₯Ό 효과적으둜 μ œμ–΄ν•˜μ—¬ LLM의 μ „λ°˜μ μΈ λŠ₯λ ₯을 λ³΄μ‘΄ν•˜λŠ” μƒˆλ‘œμš΄ ν”„λ ˆμž„μ›Œν¬(EAC)λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ EAC ν”„λ ˆμž„μ›Œν¬λŠ” 두 κ°€μ§€ 인기 μžˆλŠ” νŽΈμ§‘ 방법과 μ„Έ κ°€μ§€ LLM, λ„€ κ°€μ§€ μž‘μ—…μ— λŒ€ν•œ μ‹€ν—˜μ—μ„œ 70% μ΄μƒμ˜ μ „λ°˜μ μΈ λŠ₯λ ₯을 λ³΄μ‘΄ν•˜λ©΄μ„œλ„ νŽΈμ§‘λœ 지식을 더 잘 μœ μ§€ν•¨μ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
EACλŠ” νŽΈμ§‘ 액컀 선택을 톡해 νŽΈμ§‘ 정보λ₯Ό μ••μΆ•ν•¨μœΌλ‘œμ¨ νŽΈμ§‘μœΌλ‘œ μΈν•œ 비합리적인 편차λ₯Ό μ΅œμ†Œν™”ν•˜λŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” EAC ν”„λ ˆμž„μ›Œν¬μ˜ νš¨μœ¨μ„±μ„ λ”μš± 높이고, λ‹€μ–‘ν•œ LLM 및 νŽΈμ§‘ 방법둠에 λŒ€ν•œ 적용 κ°€λŠ₯성을 탐색할 ν•„μš”κ°€ μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘