Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

LightRetriever : une architecture de récupération hybride basée sur LLM avec une inférence de requête 1 000 fois plus rapide

Created by
  • Haebom

Auteur

Guangyuan Ma, Yongliang Ma, Xuanrui Gou, Zhenpeng Su, Ming Zhou, Songlin Hu

Contour

Cet article propose LightRetriever pour résoudre les problèmes d'efficacité de la recherche de texte basée sur des modèles de langage à grande échelle (LLM). Les méthodes de recherche basées sur les LLM actuelles nécessitent un effort de calcul important pour l'encodage des requêtes, ce qui entraîne des ralentissements et une consommation de ressources. LightRetriever utilise les LLM à grande échelle existants pour l'encodage des documents, mais améliore considérablement la vitesse en simplifiant le processus d'encodage des requêtes au niveau d'une recherche intégrée. Les résultats expérimentaux obtenus avec un GPU A800 démontrent que la vitesse d'encodage des requêtes est plus de 1 000 fois plus rapide, le débit de recherche global est plus de 10 fois plus rapide et les performances de recherche sont maintenues à une moyenne de 95 % pour diverses tâches.

Takeaways, Limitations_

Takeaways:
Présentation de LightRetriever, qui améliore considérablement la vitesse et l'efficacité des recherches basées sur LLM.
La minimisation de la charge de calcul du codage des requêtes augmente l’applicabilité aux systèmes de recherche en temps réel.
Obtenez des améliorations de vitesse tout en maintenant des performances de recherche élevées sur de grands ensembles de données.
Réduisez la consommation de ressources grâce à un codage de requête léger.
Limitations:
ÉTant donné qu'il repose sur l'intégration de recherches, la qualité des intégrations peut avoir un impact significatif sur les performances de recherche.
Il n’y a aucune garantie que la méthode proposée fournira les mêmes performances pour tous les types de requêtes de recherche.
ÉTant donné que le codage des documents utilise toujours de grands LLM, la complexité de calcul du codage des documents lui-même peut encore être importante.
Les améliorations des performances de LightRetriever ont été mesurées sur un environnement matériel spécifique (GPU A800), les performances peuvent donc varier dans d'autres environnements.
👍