Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

AdaRing: Hacia la adaptación del lenguaje y la visión ultraligeros mediante la descomposición de anillos tensoriales entre capas

Created by
  • Haebom

Autor

Ying Huang, Yuanbin Man, Wenqi Jia, Zhengzhong Tu, Junzhou Huang, Miao Yin

Describir

Este artículo propone AdaRing, un marco de ajuste fino basado en adaptadores para la aplicación eficiente de modelos de lenguaje de visión (VLM) preentrenados a gran escala a diversas subtareas. Los métodos existentes de ajuste fino basados ​​en adaptadores los integran en todas las capas para aumentar su capacidad. Sin embargo, ignoran la redundancia entre capas, lo que limita las tasas de compresión y la capacidad expresiva de los adaptadores homogéneos. AdaRing logra una adaptación ultraligera y eficiente en parámetros de los VLM mediante la integración y colaboración de múltiples adaptadores basada en la Descomposición de Anillo Tensorial (TRD) entre capas. Para eliminar la alta redundancia entre adaptadores entre capas, se aprovecha el bajo rango a nivel de tensor para formalizar los adaptadores en núcleos tensoriales compartidos por capa y segmentos específicos de capa. Además, tras un ajuste fino con capacidad de generalización, varios adaptadores basados ​​en clases colaboran para gestionar tareas que requieren diferentes representaciones. Los resultados experimentales demuestran que AdaRing alcanza un rendimiento de vanguardia a la vez que reduce el requisito promedio de parámetros de entrenamiento en un 90 %.

Takeaways, Limitations

Takeaways:
Presentamos un marco de ajuste fino de VLM ultraliviano y eficiente en parámetros que mejora la relación de compresión al considerar la redundancia entre capas.
Capacidades expresivas mejoradas para diversas tareas mediante la colaboración con varios adaptadores.
Consiga un rendimiento de vanguardia reduciendo los parámetros de entrenamiento en un 90%.
Limitations:
El rendimiento del AdaRing propuesto puede estar limitado a VLM y subtareas específicas.
Aumento potencial del coste computacional debido a la complejidad de la descomposición del anillo tensorial.
Se necesitan más análisis sobre la eficacia del ajuste fino de la conciencia de generalización.
👍