[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

LoRA Done RITE: Equilibrio de transformación invariante robusto para la optimización de LoRA

Created by
  • Haebom

Autor

Jui-Nan Yen, Si Si, Zhao Meng, Felix Yu, Sai Surya Duvvuri, Inderjit S. Dhillon, Cho-Jui Hsieh, Sanjiv Kumar

Describir

En este artículo, proponemos LoRA-RITE para abordar la falta de invariancia de traducción en los optimizadores existentes en el ajuste fino de parámetros eficientes para la adaptación de bajo rango (LoRA). LoRA-RITE es un método de preprocesamiento matricial adaptativo que logra invariancia de traducción manteniendo la eficiencia computacional. Mediante análisis teóricos y experimentos con diversos modelos y tareas LLM como Gemma 2B, 7B y mT5-XXL, demostramos que su rendimiento mejora en comparación con los optimizadores existentes. Por ejemplo, al reemplazar Adam con LoRA-RITE en el ajuste fino de LoRA en Gemma-2B, logramos una mejora de la precisión del 4,6 % en Super-Natural Instructions y del 3,5 % en otros cuatro benchmarks LLM (HellaSwag, ArcChallenge, GSM8K y OpenBookQA).

Takeaways, Limitations

Takeaways:
Presentamos un nuevo método eficiente (LoRA-RITE) para lograr la invariancia de la traducción en la optimización de LoRA.
Mejora del rendimiento verificada experimentalmente sobre los métodos existentes en varios modelos y tareas LLM.
Contribuye a mejorar la eficiencia y el rendimiento del ajuste fino basado en LoRA.
Limitations:
Se necesita más investigación sobre el rendimiento de generalización del método propuesto.
Es necesario revisar la aplicabilidad a otros tipos de LLM o métodos de ajuste.
Se necesita un análisis más detallado del costo computacional de LoRA-RITE.
👍