Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Reducción de costos de comunicación para el conteo de subgrafos bajo privacidad diferencial local mediante funciones hash

Created by
  • Haebom

Autor

Quentin Hillebrand, Vorapong Suppakitpaisarn, Tetsuo Shibuya

Describir

Este artículo propone un método para reducir los costos de comunicación mediante el uso de funciones hash en el conteo de subgrafos con privacidad diferencial local en las aristas. Los algoritmos actuales de cálculo de estadísticas de grafos basados en privacidad diferencial local en las aristas presentan altos costos de comunicación, lo que dificulta su aplicación a grafos de gran escala. En este artículo, introducimos el hash de congruencia lineal para resolver este problema. El uso de una frecuencia de muestreo $s$ puede reducir el costo de comunicación en $s^2$, pero la varianza de las estadísticas de grafos publicadas aumenta en $s$. Los resultados experimentales muestran que el error $\ell_2$ para el conteo de triángulos se reduce hasta 1000 veces en comparación con los algoritmos de vanguardia existentes con el mismo costo de comunicación.

Takeaways, Limitations

Takeaways:
Presentamos un método novedoso para contar eficientemente el número de subgráficos en un gráfico grande bajo privacidad diferencial local en los bordes.
Demostramos experimentalmente que el hash conjunto lineal puede reducir drásticamente los costos de comunicación.
En comparación con los algoritmos existentes, el error $\ell_2$ se puede reducir significativamente.
Limitations:
A medida que aumenta la frecuencia de muestreo, aumenta la varianza de las estadísticas del gráfico publicado.
La eficacia del método propuesto puede depender de la función hash específica y de la estrategia de muestreo.
Los experimentos están limitados al número de triángulos y la generalización a otros tipos de subgrafos requiere más estudios.
👍