Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Amélioration de la recherche de documents techniques pour RAG

Created by
  • Haebom

Auteur

Songjiang Lai, Tsun-Hin Cheung, Ka-Chun Fung, Kaiwen Xue, Kwan-Ho Lin, Yan-Ming Choi, Vincent Ng, Kin-Man Lam

Contour

Cet article présente Technical-Embeddings, un nouveau cadre d'optimisation de la recherche sémantique de documents techniques en développement matériel et logiciel. Il s'attache à résoudre les défis de la compréhension et de la recherche de contenus techniques complexes en exploitant les modèles de langage à grande échelle (LLM). Il élargit les requêtes utilisateur pour mieux saisir les intentions des utilisateurs et améliore la diversité des jeux de données afin d'enrichir le processus d'affinage du modèle d'intégration. De plus, il applique des techniques d'extraction de résumés pour encoder les informations clés des documents techniques et améliorer leur représentation. Un modèle BERT à double encodeur est optimisé par des invites souples, et des paramètres d'apprentissage distincts pour le contexte de la requête et du document sont utilisés pour saisir les différences sémantiques subtiles. Les résultats d'évaluation sur deux jeux de données publics, RAG-EDA et Rust-Docs-QA, démontrent que Technical-Embeddings surpasse significativement les modèles de base en termes de précision et de rappel. Cela démontre l'efficacité de l'intégration de l'expansion des requêtes et du résumé contextuel pour améliorer l'accès à l'information et la compréhension dans les domaines techniques. Cette étude fait progresser le système de récupération-génération augmentée (RAG) et présente une nouvelle méthode de récupération efficace et précise de documents techniques dans les flux de travail d'ingénierie et de développement de produits.

Takeaways, Limitations_

Takeaways:
Un cadre pour optimiser la recherche de documents techniques à l’aide de LLM est présenté.
Améliorez les performances de recherche en intégrant l’extension des requêtes et le résumé du contexte.
Capturer des différences sémantiques subtiles grâce à un réglage précis à l'aide de techniques d'invite douce.
Contribuer à l’avancement des systèmes RAG et suggérer des améliorations potentielles aux flux de travail d’ingénierie et de développement de produits.
Amélioration des performances vérifiée expérimentalement par rapport aux modèles existants sur les ensembles de données RAG-EDA et Rust-Docs-QA.
Limitations:
Les ensembles de données utilisés peuvent être limités (seuls deux ensembles de données sont utilisés : RAG-EDA et Rust-Docs-QA).
Les performances de généralisation pour d’autres types de documents techniques ou de requêtes plus complexes nécessitent une étude plus approfondie.
Des recherches supplémentaires pourraient être nécessaires pour déterminer les paramètres optimaux pour l’invite douce.
Des expériences et des vérifications supplémentaires sont nécessaires pour une application dans des environnements industriels réels.
👍