Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Trasplantar y luego regenerar: un nuevo paradigma para la ampliación de datos de texto

Created by
  • Haebom

Autor

Guangzhan Wang, Hongyu Zhang, Beijun Shen, Xiaodong Gu

Describir

Este artículo propone LMTransplant, un novedoso paradigma de aumento de texto que aprovecha los modelos lingüísticos a gran escala (LLM). Para superar las limitaciones de los métodos de aumento de texto existentes, que se centran principalmente en las transformaciones a nivel léxico y, por lo tanto, carecen de la diversidad de transformaciones manteniendo el significado, LMTransplant integra el texto fuente con el contexto extendido generado por el LLM y, posteriormente, permite que este regenere el texto transformado. Esto permite al LLM aprovechar su conocimiento inherente para generar transformaciones a nivel de contenido más diversas y creativas, preservando las propiedades fundamentales del texto fuente. Supera a los métodos existentes en diversas tareas relacionadas con el texto y demuestra una excelente escalabilidad a medida que aumenta el tamaño de los datos aumentados.

Takeaways, Limitations

Takeaways:
Proponemos un nuevo método de aumento de texto utilizando LLM para superar las limitaciones de los métodos existentes.
Capacidad para crear variaciones de texto diversas y creativas en cualquier nivel de contenido.
Preservar las propiedades fundamentales del texto original.
Excelente escalabilidad a medida que aumenta el tamaño de los datos.
Supera los métodos existentes en diversas tareas relacionadas con el texto.
Limitations:
Es posible que este documento no brinde información detallada sobre los tipos y tamaños específicos de LLM ni estrategias de ingeniería rápidas.
Sólo se presentan los resultados de la evaluación del desempeño para tareas específicas, por lo que se necesita más investigación para determinar la generalización a otras tareas.
Dado que depende del rendimiento de LLM, las limitaciones de LLM también pueden afectar el rendimiento de LMTransplant.
👍