[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

ParaPO: Alineación de modelos lingüísticos para reducir la reproducción literal de datos previos al entrenamiento

Created by
  • Haebom

Autor

Tong Chen, Faeze Brahman, Jiacheng Liu, Niloofar Mireshghallah, Weijia Shi, Pang Wei Koh, Luke Zettlemoyer, Hannaneh Hajishirzi

Describir

Este artículo propone la Optimización de Preferencias de Parafraseo (ParaPO), un método post-entrenamiento, para resolver el problema de los modelos de lenguaje (LM) que repiten el contenido de los datos pre-entrenamiento tal cual. ParaPO entrena a los LM para parafrasear el contenido memorizado en lugar de mostrarlo tal cual. También proponemos una variante de ParaPO que utiliza indicaciones del sistema para permitir el uso adecuado de citas célebres. Los resultados experimentales en los modelos Llama3.1-8B y Tulu3-8B muestran que ParaPO es más efectivo que los métodos convencionales de desaprendizaje para reducir la repetición de contenido memorizado, manteniendo al mismo tiempo la usabilidad del modelo. En particular, ParaPO, utilizando indicaciones del sistema, demuestra su eficacia para reducir la repetición no deseada de contenido, manteniendo al mismo tiempo la capacidad de recordar citas célebres.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo método (ParaPO) que resuelve eficazmente el problema de repetir el contenido de los datos previos al entrenamiento (regurgitación).
Muestra un mejor rendimiento que los métodos de desaprendizaje existentes.
Puede utilizar las indicaciones del sistema para controlar la repetición de contenido en determinadas situaciones.
Contribuye a resolver problemas de derechos de autor, plagio, privacidad y creatividad.
Limitations:
La eficacia de ParaPO podría limitarse a ciertos modelos y conjuntos de datos. Se requieren experimentos adicionales con diversos modelos y conjuntos de datos.
La forma de utilizar las indicaciones del sistema puede depender en gran medida de la ingeniería de indicaciones.
Es posible que ParaPO no pueda resolver perfectamente todos los tipos de regurgitación.
👍