Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Récupération alignée sur les références - Réponse aux questions augmentée sur des documents propriétaires hétérogènes

Created by
  • Haebom

Auteur

Nayoung Choi, Grace Byun, Andrew Chung, Ellie S. Paek, Shinsun Lee, Jinho D. Choi

Contour

Cet article propose un système de questions-réponses (QA) basé sur la génération augmentée de récupération (RAG) pour répondre aux défis d'accès à l'information liés au volume important et à la nature non structurée des documents internes des entreprises. En prenant comme exemple des documents de crash-tests issus de l'industrie automobile, nous nous concentrons sur le traitement de divers types de données, la préservation de la confidentialité des données et la traçabilité entre les réponses générées et les documents originaux. Le système proposé comprend un pipeline de données qui transforme différents types de documents en un corpus structuré et des paires de QA, une architecture locale préservant la confidentialité et un outil de mise en correspondance de références léger reliant les réponses au contenu d'appui. L'application à l'industrie automobile démontre des améliorations en termes de précision factuelle, d'informativité et de convivialité par rapport aux systèmes existants.

Takeaways, Limitations

Takeaways:
Suggérer la possibilité de résoudre les problèmes internes de récupération de documents d'entreprise et d'accès à l'information en utilisant un système d'assurance qualité basé sur RAG.
Présentation d'une méthode permettant de traiter efficacement différents types de données (multimodales).
Une proposition visant à établir un système d’assurance qualité tout en préservant la confidentialité des données internes de l’entreprise.
Améliorez la fiabilité en garantissant la traçabilité des réponses générées.
Haute applicabilité non seulement à l'industrie automobile mais également à d'autres industries
Limitations:
L'évaluation des performances du système proposé se limite à un secteur spécifique (l'automobile) et à un ensemble de données restreint. Des recherches supplémentaires sont nécessaires pour déterminer sa généralisabilité à d'autres secteurs et ensembles de données.
Manque d’analyse des coûts et des ressources nécessaires à la construction et à l’exploitation du système.
Un examen plus approfondi est nécessaire pour déterminer l’objectivité et la fiabilité des évaluations effectuées par les juges LLM.
Manque de prise en compte de l’évolutivité du système et de la dégradation potentielle des performances pour les grands ensembles de données.
👍