Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Désapprentissage des outils pour les LLM enrichis par les outils

Created by
  • Haebom

Auteur

Jiali Cheng, Hadi Amiri

Contour

Cet article présente un nouveau défi : le « désapprentissage d'outils », qui consiste à supprimer l'apprentissage d'outils spécifiques dans les LLM basés sur des outils. Contrairement au désapprentissage classique, cette approche nécessite de supprimer les connaissances elles-mêmes, plutôt que des échantillons individuels. Cette approche présente des défis, notamment le coût élevé de l'optimisation des LLM et la nécessité d'une mesure d'évaluation raisonnée. Pour y remédier, nous proposons ToolDelete, la première approche permettant de désapprendre efficacement des outils dans les LLM basés sur des outils. ToolDelete implémente trois propriétés clés pour un désapprentissage efficace des outils et introduit un nouveau modèle d'attaque par inférence d'appartenance (MIA) pour une évaluation efficace. Des expériences approfondies sur divers ensembles de données d'apprentissage d'outils et LLM basés sur des outils démontrent que ToolDelete désapprend efficacement des outils sélectionnés aléatoirement tout en préservant la connaissance des outils restants du LLM et ses performances sur des tâches courantes.

Takeaways, Limitations

Takeaways:
Nous définissons un nouveau défi appelé désapprentissage d'outils dans le LLM basé sur des outils et présentons ToolDelete, une méthode efficace pour cela.
Il a été prouvé expérimentalement que ToolDelete est efficace pour supprimer les apprentissages d'outils spécifiques en raison de vulnérabilités de sécurité, de réglementations en matière de confidentialité ou de dépréciation d'outils.
Une nouvelle méthode d’évaluation pour mesurer l’efficacité du désapprentissage des outils est présentée à travers un nouveau modèle MIA.
Limitations:
L’évaluation des performances de ToolDelete dépend du modèle MIA proposé et doit être vérifiée par d’autres mesures d’évaluation.
Bien que nous présentions des résultats expérimentaux sur divers outils et ensembles de données, des recherches supplémentaires sont nécessaires sur les performances de généralisation dans des environnements réels.
Une analyse plus approfondie est nécessaire pour déterminer la dégradation potentielle des performances globales de LLM lors du désapprentissage de l’outil.
👍