Sign In

Lost in Modality: Evaluating the Effectiveness of Text-Based Membership Inference Attacks on Large Multimodal Models

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Ziyi Tong, Feifei Sun, Le Minh Nguyen

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” λŒ€κ·œλͺ¨ λ©€ν‹°λͺ¨λ‹¬ λͺ¨λΈ(MLLMs)μ—μ„œ ν…μŠ€νŠΈ 기반 멀버십 μΆ”λ‘  곡격(MIA)의 효과λ₯Ό 처음으둜 ν¬κ΄„μ μœΌλ‘œ ν‰κ°€ν•©λ‹ˆλ‹€. κΈ°μ‘΄ LLMμ—μ„œ 널리 μ‚¬μš©λ˜λŠ” 둜그 ν™•λ₯  기반 MIAλ₯Ό λ©€ν‹°λͺ¨λ‹¬ ν™˜κ²½μœΌλ‘œ ν™•μž₯ν•˜μ—¬, λΉ„μ „-ν…μŠ€νŠΈ(V+T) 및 ν…μŠ€νŠΈ μ „μš©(T-only) μ„€μ •μ—μ„œ κ·Έ μ„±λŠ₯을 비ꡐ λΆ„μ„ν–ˆμŠ΅λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, 뢄포 λ‚΄(in-distribution) μ„€μ •μ—μ„œλŠ” 두 방식 κ°„ μ„±λŠ₯ 차이가 크지 μ•ŠμœΌλ‚˜, 뢄포 μ™Έ(out-of-distribution) μ„€μ •μ—μ„œλŠ” μ‹œκ°μ  μž…λ ₯이 μ •κ·œν™”(regularization) 효과λ₯Ό λ°œνœ˜ν•˜μ—¬ 멀버십 μ‹ ν˜Έλ₯Ό 효과적으둜 μ€λ‹‰ν•˜λŠ” κ²ƒμœΌλ‘œ λ‚˜νƒ€λ‚¬μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
λŒ€κ·œλͺ¨ λ©€ν‹°λͺ¨λ‹¬ λͺ¨λΈμ—μ„œλ„ ν…μŠ€νŠΈ 기반 MIAλŠ” 잠재적인 ν•™μŠ΅ 데이터 유좜 μœ„ν—˜μ„ ν‰κ°€ν•˜λŠ” 데 μœ μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
뢄포 μ™Έ(out-of-distribution) 데이터에 λŒ€ν•œ MIA 곡격의 νš¨κ³ΌλŠ” μ‹œκ°μ  정보에 μ˜ν•΄ 크게 저해될 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” μ‹œκ°μ  μž…λ ₯이 MIA 곡격에 λŒ€ν•œ μ •κ·œν™” 효과λ₯Ό κ°€μ§ˆ 수 μžˆμŒμ„ μ‹œμ‚¬ν•˜λ©°, μ΄λŠ” MLLM의 개인 정보 보호 섀계에 μ€‘μš”ν•œ κ³ λ € 사항이 될 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” λ‹€μ–‘ν•œ λ©€ν‹°λͺ¨λ‹¬ λͺ¨λΈ μ•„ν‚€ν…μ²˜μ™€ 곡격 기법에 λŒ€ν•œ 보닀 κ΄‘λ²”μœ„ν•œ 평가가 ν•„μš”ν•˜λ©°, μ‹œκ°μ  μž…λ ₯이 MIA 곡격을 효과적으둜 μ€λ‹‰ν•˜λŠ” λ©”μ»€λ‹ˆμ¦˜μ— λŒ€ν•œ 심측적인 뢄석이 μš”κ΅¬λ©λ‹ˆλ‹€.
πŸ‘