Sign In

ICED: Concept-level Machine Unlearning via Interpretable Concept Decomposition

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Shen Lin, Jing Lin, Junhao Dong, Piotr Koniusz, Li Xu

πŸ’‘ κ°œμš”

κΈ°μ‘΄ λΉ„μ „-μ–Έμ–΄ λͺ¨λΈ(VLM)의 기계 ν•™μŠ΅ μ œκ±°λŠ” 이미지 λ˜λŠ” κ°œλ³„ 데이터 μˆ˜μ€€μ—μ„œ 이루어져, λͺ©ν‘œν•˜μ§€ μ•Šμ€ 의미 정보λ₯Ό λ³΄μ‘΄ν•˜λ©΄μ„œ νŠΉμ • κ°œλ…μ„ μ •ν™•ν•˜κ²Œ μ œκ±°ν•˜λŠ” 데 어렀움이 μžˆμ—ˆμŠ΅λ‹ˆλ‹€. λ³Έ λ…Όλ¬Έμ—μ„œλŠ” 닀쀑λͺ¨λ“œ λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈμ„ ν™œμš©ν•˜μ—¬ 망각 λŒ€μƒ μ§‘ν•©μ—μ„œ μž‘μ—…λ³„ κ°œλ… μ–΄νœ˜λ₯Ό κ΅¬μΆ•ν•˜κ³ , μ‹œκ° ν‘œν˜„μ„ λͺ…μ‹œμ μΈ κ°œλ… λΆ„ν•΄λ₯Ό 톡해 λ―Έμ„Έν•œ 지식 μ‘°μž‘μ„ κ°€λŠ₯ν•˜κ²Œ ν•˜λŠ” ICED ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 λͺ©ν‘œ κ°œλ…μ€ μ„ νƒμ μœΌλ‘œ μ–΅μ œν•˜λ©΄μ„œλ„ 동일 이미지 λ‚΄μ˜ λΉ„λͺ©ν‘œ μ˜λ―Έμ™€ 전역적인 ꡐ차 λͺ¨λ‹¬ 지식을 λ³΄μ‘΄ν•˜λŠ” κ°œλ… μˆ˜μ€€ μ΅œμ ν™”λ₯Ό μˆ˜ν–‰ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κ°œλ… μˆ˜μ€€μ—μ„œμ˜ μ •λ°€ν•œ 지식 제거: 데이터 λ˜λŠ” 이미지 전체λ₯Ό μ œκ±°ν•˜λŠ” λŒ€μ‹ , νŠΉμ • κ°œλ…λ§Œμ„ μ„ νƒμ μœΌλ‘œ μ œκ±°ν•¨μœΌλ‘œμ¨ λͺ©ν‘œ 지식을 μ •λ°€ν•˜κ²Œ λ§κ°ν•˜κ³  κ΄€λ ¨ μ—†λŠ” 정보λ₯Ό 보쑴할 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
해석 κ°€λŠ₯μ„± 증진: μ‹œκ° ν‘œν˜„μ„ λͺ…μ‹œμ μΈ κ°œλ…λ“€μ˜ μ‘°ν•©μœΌλ‘œ λΆ„ν•΄ν•˜μ—¬ λͺ¨λΈμ˜ μž‘λ™ 방식을 더 잘 μ΄ν•΄ν•˜κ³ , 이λ₯Ό 기반으둜 지식을 μ‘°μž‘ν•˜λŠ” μΈν„°νŽ˜μ΄μŠ€λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
λͺ¨λΈ μœ ν‹Έλ¦¬ν‹° μœ μ§€: λͺ©ν‘œ κ°œλ… 제거 κ³Όμ •μ—μ„œλ„ λΉ„λͺ©ν‘œ κ°œλ… 및 전역적 ꡐ차 λͺ¨λ‹¬ 지식을 효과적으둜 λ³΄μ‘΄ν•˜μ—¬ λͺ¨λΈμ˜ μ „λ°˜μ μΈ μ„±λŠ₯ μ €ν•˜λ₯Ό μ΅œμ†Œν™”ν•©λ‹ˆλ‹€.
β€’
계산 λ³΅μž‘μ„± 및 ν•™μŠ΅ 데이터 μ˜μ‘΄μ„±: κ°œλ… μ–΄νœ˜ ꡬ좕 및 κ°œλ… λΆ„ν•΄ κ³Όμ •μ—μ„œ 좔가적인 κ³„μ‚°λŸ‰μ΄ λ°œμƒν•  수 있으며, κ°œλ… μ–΄νœ˜μ˜ ν’ˆμ§ˆμ΄ ν•™μŠ΅ 데이터 및 μ‚¬μš©ν•˜λŠ” λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈμ— 따라 λ‹¬λΌμ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘