Sign In

Shapley Neuron Values for Continual Learning: Which Neurons Matter Most?

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Mohammad Ali Vahedifar, Abhisek Ray, Qi Zhang

πŸ’‘ κ°œμš”

λ³Έ 논문은 지속 ν•™μŠ΅(Continual Learning) ν™˜κ²½μ—μ„œ λ°œμƒν•˜λŠ” 치λͺ…적 망각(catastrophic forgetting) 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ ν˜‘λ™ κ²Œμž„ 이둠에 κΈ°λ°˜ν•œ Shapley Neuron Valuation (SNV)μ΄λΌλŠ” μƒˆλ‘œμš΄ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. SNVλŠ” 각 λ‰΄λŸ°μ˜ μ€‘μš”λ„λ₯Ό μ •λŸ‰ν™”ν•˜μ—¬, μ€‘μš” λ‰΄λŸ°μ€ κ³ μ •(freeze)ν•˜κ³  μ€‘μš”ν•˜μ§€ μ•Šμ€ λ‰΄λŸ°μ€ ν•™μŠ΅ κ°€λŠ₯ν•˜λ„λ‘(plastic) μœ μ§€ν•¨μœΌλ‘œμ¨ μ•„ν‚€ν…μ²˜ ν™•μž₯μ΄λ‚˜ 버퍼 없이 지속 ν•™μŠ΅μ„ κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€. ImageNet-1k 데이터셋 μ‹€ν—˜ κ²°κ³Ό, SNVλŠ” κΈ°μ‘΄ 버퍼 μ—†λŠ”(buffer-free) 방법둠듀보닀 μΌκ΄€λ˜κ²Œ μš°μˆ˜ν•œ μ„±λŠ₯을 λ³΄μ˜€μœΌλ©°, 특히 클래슀 점진 ν•™μŠ΅ 및 νƒœμŠ€ν¬ 점진 ν•™μŠ΅ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ μƒλ‹Ήν•œ 정확도 ν–₯상을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
핡심 μ‹œμ‚¬μ  1: SNVλŠ” ν˜‘λ™ κ²Œμž„ 이둠의 Shapley Value κ°œλ…μ„ λ„μž…ν•˜μ—¬ 지속 ν•™μŠ΅μ—μ„œ λ‰΄λŸ°μ˜ μ€‘μš”λ„λ₯Ό μ›μΉ™μ μœΌλ‘œ ν‰κ°€ν•˜λŠ” μƒˆλ‘œμš΄ 방법을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
핡심 μ‹œμ‚¬μ  2: μ•„ν‚€ν…μ²˜ ν™•μž₯μ΄λ‚˜ λ³„λ„μ˜ μ €μž₯ 곡간(버퍼) 없이 μ€‘μš”ν•œ λ‰΄λŸ°μ„ μ‹λ³„ν•˜κ³  κ³ μ •ν•¨μœΌλ‘œμ¨, 효율적인 지속 ν•™μŠ΅ λͺ¨λΈμ„ ꡬ좕할 수 μžˆλŠ” κ°€λŠ₯성을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
ν•œκ³„μ  λ˜λŠ” ν–₯ν›„ 과제: μ œμ•ˆλœ SNV의 계산 λ³΅μž‘μ„±μ΄ 컀질 경우, λŒ€κ·œλͺ¨ λͺ¨λΈμ΄λ‚˜ λ³΅μž‘ν•œ 지속 ν•™μŠ΅ νƒœμŠ€ν¬μ—μ„œλŠ” μ μš©μ— μ œμ•½μ΄ μžˆμ„ 수 있으며, μ‹€μ œ λ‹€μ–‘ν•œ 지속 ν•™μŠ΅ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œμ˜ μΌλ°˜ν™” μ„±λŠ₯ 검증이 μΆ”κ°€μ μœΌλ‘œ ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘