Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

PersonaBench: Evaluación de modelos de IA para la comprensión de información personal mediante el acceso a datos privados (sintéticos) de usuarios

Created by
  • Haebom

Autor

Juntao Tan, Liangwei Yang, Zuxin Liu, Zhiwei Liu, Rithesh Murthy, Tulika Manoj Awalgaonkar, Jianguo Zhang, Weiran Yao, Ming Zhu, Shirley Kokane, Silvio Savarese, Huan Wang, Caiming Xiong, Shelby Heinecke

Describir

Este documento destaca la importancia de la personalización en el contexto de los asistentes de IA personalizados, en particular los modelos de IA privados que aprovechan los datos privados de los usuarios. Nos centramos en evaluar la capacidad de los modelos de IA para acceder e interpretar los datos privados de los usuarios (p. ej., historial de conversaciones, interacciones usuario-IA, historial de uso de la aplicación) para comprender la información personal de los usuarios (p. ej., información biográfica, preferencias, relaciones sociales, etc.). Reconociendo la disponibilidad limitada de conjuntos de datos disponibles públicamente debido a la naturaleza sensible de estos datos, presentamos una canalización de generación de datos sintéticos que genera documentos privados que simulan perfiles de usuario diversos y realistas y actividades personales. Con base en esto, proponemos un punto de referencia, PersonaBench, para evaluar el rendimiento de los modelos de IA que comprenden la información privada extraída de datos privados simulados de usuarios. Utilizando una canalización de Recuperación-Generación Aumentada (RAG), evaluamos el rendimiento de los modelos de IA que comprenden la información privada extraída de datos privados simulados de usuarios. Nuestros resultados revelan que los modelos actuales de IA basados ​​en RAG tienen dificultades para extraer información personal de los documentos de los usuarios y responder preguntas privadas, lo que destaca la necesidad de metodologías mejoradas para mejorar las capacidades de personalización de la IA.

Takeaways, Limitations

Takeaways: Presentamos un nuevo punto de referencia (PersonaBench) para evaluar las capacidades de personalización de los modelos de IA que utilizan datos personales privados. Al revelar las limitaciones de la capacidad de los modelos actuales de IA basados ​​en RAG para comprender información personal, sugerimos futuras líneas de investigación. También presentamos un método para generar datos similares a los reales, abordando al mismo tiempo las cuestiones de privacidad mediante un proceso de generación de datos sintéticos.
Limitations: PersonaBench se basa en datos sintéticos, por lo que puede diferir de las evaluaciones que utilizan datos reales de usuarios. Esta evaluación se limita al pipeline de RAG, por lo que se requiere más investigación para evaluar otros tipos de modelos de IA. Es posible que no refleje plenamente la diversidad y complejidad de la información personal.
👍