Sign In

Surviving the Unseen: Predictive Defense for Novel Multi-Turn Multimodal Attacks

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Doohee You

πŸ’‘ κ°œμš”

λ©€ν‹°λͺ¨λ‹¬ λŒ€ν˜• μ–Έμ–΄ λͺ¨λΈ(MLLM)이 자율 μ—μ΄μ „νŠΈ μ›Œν¬ν”Œλ‘œμš°μ— ν†΅ν•©λ˜λ©΄μ„œ μ˜ˆμΈ‘ν•˜κΈ° μ–΄λ €μš΄ 비정상적인 곡격 ν‘œλ©΄μ΄ λ‚˜νƒ€λ‚¬μŠ΅λ‹ˆλ‹€. λ³Έ 논문은 기쑴의 정적 λ°©μ–΄ λ©”μ»€λ‹ˆμ¦˜μ΄ 닀쀑 ν„΄, 닀쀑 λͺ¨λ‹¬ κ³΅κ²©μ—μ„œ λˆ„μ λ˜λŠ” μ•…μ˜μ  μ˜λ„λ₯Ό νƒμ§€ν•˜μ§€ λͺ»ν•˜λŠ” ν•œκ³„λ₯Ό μ§€μ ν•©λ‹ˆλ‹€. 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, λ³Έ μ—°κ΅¬μ—μ„œλŠ” TRIAD(Triple-tier Anomaly Defense)λΌλŠ” 동적 생쑴 예츑 ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•˜λ©°, μ΄λŠ” λŒ€ν™” 흐름을 연속적인 ꢀ적으둜 λͺ¨λΈλ§ν•˜μ—¬ ꡬ쑰적 이상 탐지, 고차원 κ³΅κ°„μ—μ„œμ˜ 곡뢄산 λ³€ν™” λͺ¨λ‹ˆν„°λ§, 그리고 μ•…μ˜μ  λ“œλ¦¬ν”„νŠΈμ™€ 정상적인 탐색을 κ΅¬λΆ„ν•˜λŠ” μœ„μƒν•™μ  ꢀ적 가속화 기법을 ν†΅ν•©ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
닀쀑 ν„΄, 닀쀑 λͺ¨λ‹¬ 곡격에 λŒ€ν•œ 예츑 λ°©μ–΄ κ°€λŠ₯μ„± μ œμ‹œ: 기쑴의 κ°œλ³„ μž…λ ₯ 기반 λ°©μ–΄μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³ , μ‹œκ°„μ˜ 흐름에 λ”°λ₯Έ λŒ€ν™” ꢀ적을 λΆ„μ„ν•˜μ—¬ λˆ„μ λ˜λŠ” μ•…μ˜μ  곡격을 사전에 μ˜ˆμΈ‘ν•˜κ³  λ°©μ–΄ν•  수 μžˆλŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
동적이고 계산 효율적인 μ‹€μ‹œκ°„ λ°©μ–΄ ν”„λ ˆμž„μ›Œν¬: TRIADλŠ” λ² μ΄μ§€μ•ˆ HMM ν”Όλ“œλ°± 루프λ₯Ό 톡해 μ‹€μ‹œκ°„μœΌλ‘œ λ™μ μœΌλ‘œ μž‘λ™ν•˜λ©°, 이둠적으둜 곡격 ν•˜μ—μ„œμ˜ κΈ°λŒ€ μ‹€νŒ¨ μ‹œκ°„(expected time-to-failure)을 μˆ˜ν•™μ μœΌλ‘œ μ œν•œν•˜μ—¬ 계산 효율적이고 해석 κ°€λŠ₯ν•œ λ°©μ–΄ 체계λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
μƒˆλ‘œμš΄ μœ ν˜•μ˜ 곡격에 λŒ€ν•œ μΌλ°˜ν™” 및 적용 λ²”μœ„: μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬λŠ” κ²½ν—˜μ  μž¬ν•™μŠ΅μ— μ˜μ‘΄ν•˜μ§€ μ•Šκ³ λ„ 지속적인 μ•ˆμ „ 정렬을 μœ„ν•œ μ—„κ²©ν•œ 이둠적 κΈ°λ°˜μ„ λ§ˆλ ¨ν•˜μ§€λ§Œ, λ‹€μ–‘ν•œ μœ ν˜•μ˜ λ©€ν‹°λͺ¨λ‹¬ 곡격에 λŒ€ν•œ μ‹€μ œ 적용 및 μ„±λŠ₯ 검증, 그리고 ν”„λ ˆμž„μ›Œν¬μ˜ νŠΉμ • ꡬ성 μš”μ†Œ(예: Ledoit-Wolf μ •κ·œν™”, μœ„μƒν•™μ  가속화)의 μΌλ°˜ν™” λŠ₯λ ₯에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘