Sign In

CatNet: Controlling the False Discovery Rate in LSTM with SHAP Feature Importance and Gaussian Mirrors

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Jiaan Han, Junxiao Chen, Yanzhe Fu

πŸ’‘ κ°œμš”

이 μ—°κ΅¬λŠ” LSTM λͺ¨λΈμ—μ„œ ν—ˆμœ„ 발견율(FDR)을 효과적으둜 μ œμ–΄ν•˜κ³  μœ μ˜λ―Έν•œ νŠΉμ§•μ„ μ„ νƒν•˜κΈ° μœ„ν•œ CatNet μ•Œκ³ λ¦¬μ¦˜μ„ μ œμ•ˆν•©λ‹ˆλ‹€. CatNet은 SHAP κ°’μ˜ 미뢄을 ν™œμš©ν•˜μ—¬ νŠΉμ§• μ€‘μš”λ„λ₯Ό μ •λŸ‰ν™”ν•˜κ³ , κ°€μš°μ‹œμ•ˆ 미러 μ•Œκ³ λ¦¬μ¦˜μ„ 톡해 FDR μ œμ–΄λ₯Ό μœ„ν•œ 벑터 ν˜•νƒœμ˜ 미러 ν†΅κ³„λŸ‰μ„ κ΅¬μ„±ν•©λ‹ˆλ‹€. λ˜ν•œ, νŠΉμ§• κ°„ λΉ„μ„ ν˜• λ˜λŠ” μ‹œκ°„μ  μƒκ΄€κ΄€κ³„λ‘œ μΈν•œ λΆˆμ•ˆμ •μ„±μ„ λ°©μ§€ν•˜κΈ° μœ„ν•΄ μƒˆλ‘œμš΄ 컀널 기반 독립성 μΈ‘μ • 방법을 μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LSTM λͺ¨λΈμ—μ„œ νŠΉμ§• μ€‘μš”λ„λ₯Ό 기반으둜 FDR을 μ œμ–΄ν•˜λŠ” μƒˆλ‘œμš΄ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ‹œν•˜μ—¬ λͺ¨λΈμ˜ 과적합을 쀄이고 해석 κ°€λŠ₯성을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.
β€’
SHAP κ°’κ³Ό κ°€μš°μ‹œμ•ˆ 미러 μ•Œκ³ λ¦¬μ¦˜μ„ κ²°ν•©ν•˜κ³ , νŠΉμ§• κ°„ 독립성 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ μƒˆλ‘œμš΄ 방법을 λ„μž…ν•˜μ—¬ λ‹€μ–‘ν•œ λ°μ΄ν„°μ…‹μ—μ„œ κ°•κ±΄ν•œ μ„±λŠ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬λŠ” λ‹€λ₯Έ μ‹œκ³„μ—΄ λ˜λŠ” 순차적 λ”₯λŸ¬λ‹ λͺ¨λΈλ‘œμ˜ ν™•μž₯이 μš©μ΄ν•©λ‹ˆλ‹€.
β€’
컀널 기반 독립성 μΈ‘μ • λ°©λ²•μ˜ 계산 λ³΅μž‘μ„±μ΄λ‚˜ νŠΉμ • 데이터 λΆ„ν¬μ—μ„œμ˜ μ„±λŠ₯에 λŒ€ν•œ 좔가적인 κ²€ν† κ°€ ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘