Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Communication Cost Reduction for Subgraph Counting under Local Differential Privacy via Hash Functions

Created by
  • Haebom

저자

Quentin Hillebrand, Vorapong Suppakitpaisarn, Tetsuo Shibuya

개요

본 논문은 에지 로컬 차등 프라이버시(edge local differential privacy) 하에서 서브그래프 개수를 세는 과정에서 해시 함수를 사용하여 통신 비용을 줄이는 방법을 제안합니다. 기존의 에지 로컬 차등 프라이버시 기반 그래프 통계량 계산 알고리즘들은 높은 통신 비용으로 인해 대규모 그래프에 적용하기 어려운데, 본 논문에서는 선형 합동 해싱(linear congruence hashing)을 도입하여 이 문제를 해결합니다. 샘플링 비율 $s$를 사용하여 통신 비용을 $s^2$만큼 줄일 수 있지만, 발표된 그래프 통계량의 분산은 $s$만큼 증가합니다. 실험 결과, 통신 비용이 동일한 경우 삼각형 개수에 대한 $\ell_2$-error가 기존 최고 성능 알고리즘에 비해 최대 1000배까지 감소함을 보였습니다.

시사점, 한계점

시사점:
에지 로컬 차등 프라이버시 하에서 대규모 그래프의 서브그래프 개수를 효율적으로 계산하는 새로운 방법을 제시합니다.
선형 합동 해싱을 이용하여 통신 비용을 획기적으로 줄일 수 있음을 실험적으로 증명합니다.
기존 알고리즘에 비해 $\ell_2$-error를 크게 감소시킬 수 있습니다.
한계점:
샘플링 비율 증가에 따라 발표된 그래프 통계량의 분산이 증가합니다.
제안된 방법의 효율성은 특정 해시 함수와 샘플링 전략에 의존적일 수 있습니다.
실험은 삼각형 개수에 국한되어 있으며, 다른 종류의 서브그래프에 대한 일반화 가능성은 추가 연구가 필요합니다.
👍