Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

DIVER : une approche en plusieurs étapes pour la recherche d'informations intensive en raisonnement

Created by
  • Haebom

Auteur

Meixiu Long, Duolin Sun, Dan Yang, Junjie Wang, Yue Shen, Jian Wang, Peng Wei, Jinjie Gu, Jiahai Wang

Contour

Cet article aborde les limites des modèles de recherche générative augmentée, qui offrent des performances robustes dans les tâches à forte intensité de connaissances, où la pertinence requête-document peut être identifiée par correspondance lexicale ou sémantique directe. Les systèmes de recherche existants peinent à capturer de nombreuses requêtes réelles impliquant un raisonnement abstrait, une pensée analogique ou un raisonnement en plusieurs étapes. Pour relever ce défi, nous présentons DIVER , un pipeline de recherche conçu pour la recherche d'informations à forte intensité d'inférence . DIVER se compose de quatre éléments : le traitement des documents pour améliorer la qualité des entrées, l'expansion des requêtes basée sur le LLM via une interaction itérative avec les documents, un moteur de recherche optimisé par inférence et optimisé sur des données multidomaines synthétiques utilisant des négatifs durs, et un reranker point par point qui combine les scores d'utilité attribués par le LLM avec les scores de recherche. Sur le benchmark BRIGHT, DIVER surpasse systématiquement les modèles concurrents prenant en compte l'inférence, obtenant des scores nDCG@10 de pointe de 41,6 et 28,9 pour la requête initiale. Ces résultats démontrent l'efficacité des stratégies de récupération basées sur l'inférence pour des tâches complexes du monde réel. Le code et le modèle de récupération seront prochainement rendus publics.

Takeaways, Limitations

Takeaways: Nous présentons DIVER, un nouveau pipeline de recherche performant pour la recherche d'informations intensive en inférence. Nous obtenons des performances de pointe sur le benchmark BRIGHT. Nous démontrons l'efficacité de l'expansion de requêtes basée sur LLM et des moteurs de recherche optimisés par inférence. Nous soulignons l'importance des stratégies de recherche prenant en compte l'inférence dans les tâches complexes du monde réel.
Limitations : Le code et le modèle de recherche ne sont pas encore accessibles au public. Une vérification des performances sur des benchmarks autres que le benchmark BRIGHT est requise. Des évaluations des performances de généralisation pour différents types de tâches d'inférence sont également nécessaires.
👍