[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

LoRA Done RITE : Équilibrage robuste des transformations invariantes pour l'optimisation LoRA

Created by
  • Haebom

Auteur

Jui-Nan Yen, Si Si, Zhao Meng, Felix Yu, Sai Surya Duvvuri, Inderjit S. Dhillon, Cho-Jui Hsieh, Sanjiv Kumar

Contour

Dans cet article, nous proposons LoRA-RITE pour pallier le manque d'invariance de translation des optimiseurs existants dans le cadre du réglage fin paramétrique efficace pour l'adaptation de bas rang (LoRA). LoRA-RITE est une méthode de prétraitement matriciel adaptatif qui assure l'invariance de translation tout en maintenant l'efficacité de calcul. Grâce à des analyses théoriques et des expérimentations sur divers modèles et tâches LLM tels que Gemma 2B, 7B et mT5-XXL, nous démontrons que ses performances sont supérieures à celles des optimiseurs existants. Par exemple, en remplaçant Adam par LoRA-RITE dans le réglage fin LoRA sur Gemma-2B, nous obtenons une amélioration de la précision de 4,6 % dans les instructions surnaturelles et de 3,5 % dans les quatre autres benchmarks LLM (HellaSwag, ArcChallenge, GSM8K et OpenBookQA).

Takeaways, Limitations

Takeaways:
Nous présentons une nouvelle méthode efficace (LoRA-RITE) pour obtenir l'invariance de traduction dans l'optimisation LoRA.
Amélioration des performances vérifiée expérimentalement par rapport aux méthodes existantes sur divers modèles et tâches LLM.
Contribue à améliorer l'efficacité et les performances du réglage fin basé sur LoRA.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
L’applicabilité à d’autres types de LLM ou de méthodes de réglage fin doit être examinée.
Une analyse plus détaillée du coût de calcul de LoRA-RITE est nécessaire.
👍