본 논문은 Machine Learning as a Service (MLaaS) 플랫폼에서 모델 추출 공격(MEA)에 대한 취약성을 다룹니다. 특히, 설명 가능한 AI (XAI)의 통합으로 인해 반실제 예시(CF)를 이용한 MEA가 용이해진 점에 주목합니다. 논문에서는 차별적 프라이버시(DP)를 이용하여 모델 성능, 프라이버시, 설명 가능성 간의 절충점을 조사합니다. DP 전략으로는 분류 모델 훈련 단계와 CF 생성 단계에서 DP를 적용하는 두 가지 방법을 평가합니다.
시사점, 한계점
•
시사점:
◦
MLaaS 플랫폼의 보안 및 개인정보 보호 강화를 위한 차별적 프라이버시(DP) 적용 방안 제시
◦
모델 훈련 단계와 CF 생성 단계에서의 DP 적용 전략 비교 분석을 통해 최적의 절충점 도출 가능성 제시