Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Desaprendizaje de herramientas para LLM mejorados con herramientas

Created by
  • Haebom

Autor

Jiali Cheng y Hadi Amiri

Describir

Este artículo presenta un desafío novedoso: el "desaprendizaje de herramientas", que elimina el aprendizaje sobre herramientas específicas de los LLM basados en herramientas. A diferencia del desaprendizaje convencional, este enfoque requiere eliminar el conocimiento en sí, en lugar de muestras individuales. Este enfoque presenta desafíos, como el alto costo de la optimización de LLM y la necesidad de una métrica de evaluación basada en principios. Para abordar estos desafíos, proponemos ToolDelete, el primer enfoque para desaprender herramientas eficazmente en LLM basados en herramientas. ToolDelete implementa tres propiedades clave para un desaprendizaje eficaz de herramientas e introduce un novedoso modelo de Ataque de Inferencia de Membresía (MIA) para una evaluación eficaz. Experimentos exhaustivos con diversos conjuntos de datos de entrenamiento de herramientas y LLM basados en herramientas demuestran que ToolDelete desaprende eficazmente herramientas seleccionadas aleatoriamente, a la vez que preserva el conocimiento del LLM sobre las herramientas restantes y su rendimiento en tareas comunes.

Takeaways, Limitations

Takeaways:
Definimos un nuevo desafío llamado desaprendizaje de herramientas en LLM basado en herramientas y presentamos ToolDelete, un método efectivo para esto.
Se ha demostrado experimentalmente que ToolDelete es eficaz para eliminar aprendizajes de herramientas específicas debido a vulnerabilidades de seguridad, regulaciones de privacidad o desuso de herramientas.
Se presenta un nuevo método de evaluación para medir la efectividad del desaprendizaje de herramientas a través de un nuevo modelo MIA.
Limitations:
La evaluación del rendimiento de ToolDelete depende del modelo MIA propuesto y debe verificarse mediante otras métricas de evaluación.
Aunque presentamos resultados experimentales en varias herramientas y conjuntos de datos, se necesita más investigación sobre el rendimiento de generalización en entornos del mundo real.
Se necesitan más análisis para determinar la posible degradación general del rendimiento de LLM durante el desaprendizaje de la herramienta.
👍