Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

PersonaBench : Évaluation des modèles d'IA pour la compréhension des informations personnelles via l'accès aux données utilisateur privées (synthétiques)

Created by
  • Haebom

Auteur

Juntao Tan, Liangwei Yang, Zuxin Liu, Zhiwei Liu, Rithesh Murthy, Tulika Manoj Awalgaonkar, Jianguo Zhang, Weiran Yao, Ming Zhu, Shirley Kokane, Silvio Savarese, Huan Wang, Caiming Xiong, Shelby Heinecke

Contour

Cet article souligne l'importance de la personnalisation dans le contexte des assistants IA personnalisés, en particulier des modèles d'IA privés exploitant les données privées des utilisateurs. Nous nous concentrons sur l'évaluation de la capacité des modèles d'IA à accéder aux données privées des utilisateurs et à les interpréter (par exemple, l'historique des conversations, les interactions utilisateur-IA, l'historique d'utilisation des applications) afin de comprendre leurs informations personnelles (par exemple, leurs informations biographiques, leurs préférences, leurs relations sociales, etc.). Conscients de la disponibilité limitée des ensembles de données accessibles au public en raison de leur nature sensible, nous présentons un pipeline de génération de données synthétiques qui génère des documents privés simulant des profils d'utilisateurs et des activités personnelles diversifiés et réalistes. Sur cette base, nous proposons un benchmark, PersonaBench, pour évaluer les performances des modèles d'IA qui comprennent les informations privées extraites de données d'utilisateurs privées simulées. À l'aide d'un pipeline de génération augmentée de récupération (RAG), nous évaluons les performances des modèles d'IA qui comprennent les informations privées extraites de données d'utilisateurs privées simulées. Nos résultats révèlent que les modèles d'IA actuels basés sur RAG ont du mal à extraire des informations personnelles des documents des utilisateurs et à répondre à des questions privées, soulignant la nécessité de méthodologies améliorées pour améliorer les capacités de personnalisation de l'IA.

Takeaways, Limitations

Takeaways: Nous présentons un nouveau benchmark (PersonaBench) pour évaluer les capacités de personnalisation des modèles d'IA utilisant des données personnelles privées. En révélant les limites de la capacité des modèles d'IA actuels basés sur RAG à comprendre les informations personnelles, nous suggérons des pistes de recherche futures. Nous présentons également une méthode permettant de générer des données similaires aux données réelles tout en répondant aux préoccupations en matière de confidentialité grâce à un pipeline de génération de données synthétiques.
Limitations : PersonaBench est basé sur des données synthétiques ; il peut donc différer des évaluations utilisant des données utilisateur réelles. Cette évaluation se limite au pipeline RAG ; des recherches supplémentaires sont donc nécessaires pour évaluer d'autres types de modèles d'IA. Il se peut qu'elle ne reflète pas pleinement la diversité et la complexité des informations personnelles.
👍