Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Accélérer l'extraction de données à l'aide d'un modèle de langage étendu (LLM) et d'un protocole de revue de portée : une étude méthodologique dans le cadre d'une revue de portée complexe

Created by
  • Haebom

Auteur

James Stewart-Evans, Emma Wilson, Tessa Langley, Andrew Prayle, Angela Hands, Karen Exley, Jo Leonardi-Bee

Contour

Cet article présente les résultats d'une expérience sur deux approches visant à simplifier le processus d'extraction de données des revues de portée à l'aide du modèle de langage à grande échelle (LLM), Claude 3.5 Sonnet. L'extraction des données a été réalisée à l'aide d'un protocole de revue prédéfini pour 10 sources de preuves, et une revue basée sur le protocole a été réalisée sur les données extraites. Une précision élevée (83,3 % et 100 %) a été obtenue pour l'extraction d'informations de citation simples et clairement définies, mais une faible précision (9,6 % et 15,8 %) a été obtenue pour l'extraction d'éléments de données complexes et subjectifs. Lorsque tous les éléments de données ont été pris en compte, les deux approches ont atteint une précision supérieure à 90 %, mais le rappel était inférieur à 25 % et les scores F1 étaient inférieurs à 40 %. Le contexte complexe de la revue de portée, le format de réponse ouvert et l'approche méthodologique peuvent avoir influencé la performance. Les commentaires du LLM ont suggéré que les résultats d'extraction de base étaient exacts et ne nécessitaient que des modifications mineures, mais des expériences répétées utilisant un ensemble de données contenant des erreurs intentionnelles n'ont détecté que 5 % des erreurs.

Takeaways, Limitations

Takeaways:
Présentation de la possibilité d'améliorer l'efficacité du processus d'extraction et de révision des données à l'aide de LLM.
Identifier le potentiel d’amélioration des protocoles d’évaluation à l’aide des commentaires du LLM.
Soulignez l’importance de l’évaluation des performances et des rapports lors de l’extraction de données basées sur LLM.
Limitations:
ÉValuation limitée des performances : manque d’évaluation globale des performances dans différents contextes de LLM et d’évaluation.
Faible rappel et score F1 : faible précision et données importantes manquantes lors de l'extraction d'éléments de données complexes.
Faible taux de détection d’erreur : Faible taux de détection d’erreur dans les ensembles de données contenant des erreurs intentionnelles.
Manque de comparaison avec les approches d’ingénierie rapide existantes.
👍