[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Adaptación eficiente de un transformador de visión preentrenado sustentado por una estrategia de ajuste fino aproximadamente ortogonal

Created by
  • Haebom

Autor

Yiting Yang, Hao Luo, Yuan Sun, Qingsen Yan, Haokui Zhang, Wei Dong, Guoqing Wang, Peng Wang, Yang Yang, Hengtao Shen

Describir

Este artículo señala las limitaciones de las matrices de peso adaptativas de baja dimensión (como LoRA y Adapter), utilizadas principalmente en el ajuste fino con eficiencia de parámetros (PEFT) del transformador de visión (ViT), y presenta un método mejorado. Los métodos existentes no pueden reflejar la ortogonalidad aproximada de los parámetros preaprendidos de la estructura principal en matrices de baja dimensión, lo que provoca un bajo rendimiento de generalización. En este artículo, proponemos una estrategia de ajuste fino aproximadamente ortogonal (AOFT) que construye una matriz de baja dimensión mediante la generación de vectores ortogonales aproximados utilizando un único vector aprendible. A través de esto, demostramos experimentalmente que mejora el rendimiento de generalización al impartir propiedades similares a los parámetros preaprendidos de la estructura principal a las matrices de baja dimensión, y logra un rendimiento competitivo en diversas tareas de clasificación de imágenes.

Takeaways, Limitations

Takeaways:
Demostramos que la aplicación de la ortogonalidad aproximada de la estructura principal ViT preentrenada a matrices de adaptación de baja dimensión puede mejorar el rendimiento de generalización.
Demostramos que la estrategia AOFT puede mejorar el rendimiento de PEFT y lograr resultados competitivos.
Presentamos un método eficiente para generar matrices ortogonales aproximadas utilizando un único vector aprendible.
Limitations:
Dado que la eficacia de la estrategia AOFT propuesta se limita a las tareas de clasificación de imágenes, su generalización a otras tareas de visión requiere más estudios.
Hay una falta de análisis teórico sobre el impacto de la ortogonalidad aproximada en la mejora del rendimiento de generalización.
Es necesario un análisis comparativo más profundo con otros métodos PEFT.
👍