Sign In

MetaKE: Meta-Learning for Knowledge Editing Toward a Better Accuracy-Editability Trade-off

Created by
  • Haebom
Category
Empty

μ €μž

Shuxin Liu, Di Gao, Ou Wu

πŸ’‘ κ°œμš”

κΈ°μ‘΄ 지식 νŽΈμ§‘(KE) 방법둠은 λͺ©ν‘œ ν‘œν˜„ μ΅œμ ν™”μ™€ μ œμ•½ 쑰건 ν•˜μ˜ νŒŒλΌλ―Έν„° μ΅œμ ν™”λ₯Ό λΆ„λ¦¬ν•˜μ—¬ μ§„ν–‰ν–ˆμœΌλ‚˜, 이 κ³Όμ •μ—μ„œ λ°œμƒν•˜λŠ” μ΅œμ ν™” λ‹¨μ ˆλ‘œ 인해 정확도-νŽΈμ§‘ κ°€λŠ₯μ„± κ· ν˜•μ„ 효과적으둜 μ‘°μ ˆν•˜κΈ° μ–΄λ €μ› μŠ΅λ‹ˆλ‹€. λ³Έ 논문은 μ΄λŸ¬ν•œ 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ μƒν•˜μœ„ 단계λ₯Ό ν†΅ν•©ν•œ 메타 ν•™μŠ΅ 기반 ν”„λ ˆμž„μ›Œν¬μΈ MetaKEλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. MetaKEλŠ” ν•˜μœ„ λ‹¨κ³„μ˜ μ œμ•½ 쑰건 ν”Όλ“œλ°±μ„ ν™œμš©ν•˜μ—¬ μƒμœ„ λ‹¨κ³„μ˜ ν‘œν˜„μ„ μ΅œμ ν™”ν•¨μœΌλ‘œμ¨, 더 λ‚˜μ€ 의미둠적 정확도-νŽΈμ§‘ κ°€λŠ₯μ„± κ· ν˜•μ„ λ‹¬μ„±ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
메타 ν•™μŠ΅μ„ 톡해 지식 νŽΈμ§‘μ˜ μƒν•˜μœ„ 단계λ₯Ό ν†΅ν•©ν•˜κ³ , ν•˜μœ„ μ œμ•½ 쑰건의 ν”Όλ“œλ°±μ„ ν™œμš©ν•˜μ—¬ 졜적의 정확도-νŽΈμ§‘ κ°€λŠ₯μ„± κ· ν˜•μ„ 달성할 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ Structural Gradient Proxy 기법은 계산 λΉ„μš©μ΄ 큰 λ‹€μΈ΅ μ—­μ „νŒŒ 없이도 ν•˜μœ„ λ‹¨κ³„μ˜ ν”Όλ“œλ°±μ„ 효과적으둜 κ·Όμ‚¬ν•˜κ³  μ „νŒŒν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
MetaKEλŠ” κΈ°μ‘΄ 방법둠 λŒ€λΉ„ μš°μˆ˜ν•œ μ„±λŠ₯을 보여 지식 νŽΈμ§‘ 뢄야에 μƒˆλ‘œμš΄ 연ꡬ λ°©ν–₯을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
Structural Gradient Proxy의 근사 정확도 및 λ‹€μ–‘ν•œ μ œμ•½ 쑰건에 λŒ€ν•œ μΌλ°˜ν™” μ„±λŠ₯ ν–₯상이 ν–₯ν›„ 과제둜 λ‚¨μŠ΅λ‹ˆλ‹€.
πŸ‘