Sign In

A Consensus Privacy Metrics Framework for Synthetic Data

Created by
  • Haebom
Category
Empty

저자

Lisa Pilgram, Fida K. Dankar, Jorg Drechsler, Mark Elliot, Josep Domingo-Ferrer, Paul Francis, Murat Kantarcioglu, Linglong Kong, Bradley Malin, Krishnamurty Muralidhar, Puja Myles, Fabian Prasser, Jean Louis Raisaro, Chao Yan, Khaled El Emam

개요

합성 데이터 생성은 개인 수준의 데이터 공유를 위한 한 가지 접근 방식입니다. 그러나 법적 요구 사항을 충족하려면 개인의 프라이버시가 적절히 보호됨을 입증해야 합니다. 합성 데이터의 프라이버시를 측정하기 위한 통합된 표준은 없습니다. 전문가 패널과 합의 과정을 통해 합성 데이터의 프라이버시를 평가하기 위한 프레임워크를 개발했습니다. 연구 결과에 따르면 현재 유사성 측정 지표는 신원 공개를 측정하지 못하며, 이러한 지표의 사용은 권장하지 않습니다. 차등적 프라이버시 합성 데이터의 경우, 거의 0이 아닌 개인 정보 보호 예산은 해석 불가능한 것으로 간주되었습니다. 신원을 직접적으로 공개하지 않고도 개인에 대한 개인 정보를 추론하는 멤버십 및 속성 공개의 중요성에 대한 합의가 있었습니다. 결과적으로 얻어진 프레임워크는 이러한 유형의 공개를 효과적으로 해결하는 측정 지표에 대한 정확한 권장 사항을 제공합니다. 또한 합성 데이터의 광범위한 채택에 도움이 될 수 있는 미래 연구를 위한 구체적인 기회를 제시합니다.

시사점, 한계점

시사점: 합성 데이터의 프라이버시 평가를 위한 새로운 프레임워크 개발. 멤버십 및 속성 공개와 같은 프라이버시 위험에 대한 효과적인 측정 지표 제시. 미래 연구를 위한 구체적인 방향 제시.
한계점: 현재 유사성 측정 지표의 신원 공개 측정 실패. 차등적 프라이버시 합성 데이터에서 0에 가까운 것이 아닌 개인 정보 보호 예산의 해석 어려움. 개발된 프레임워크의 광범위한 채택을 위한 추가 연구 필요.
👍