Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

STRUCTSENSE : un cadre agentique indépendant des tâches pour l'extraction d'informations structurées avec évaluation et analyse comparative en temps réel

Created by
  • Haebom

Auteur

Tek Raj Chhetri, Yibei Chen, Puja Trivedi, Dorota Jarecka, Saif Haobsh, Patrick Ray, Lydia Ng, Satrajit S. Ghosh

Contour

Cet article vise à accélérer l'extraction d'informations structurées à partir de données non structurées (par exemple, documents en texte libre, littérature scientifique) afin d'améliorer la découverte scientifique et l'intégration des connaissances. Si les modèles linguistiques à grande échelle (MLH) ont démontré d'excellentes performances pour diverses tâches de traitement du langage naturel, ils sont moins efficaces dans certains domaines exigeant des connaissances spécialisées et une compréhension nuancée, et souffrent d'un manque de transférabilité entre tâches et domaines. Pour relever ces défis, nous présentons StructSense, un framework open source modulaire et indépendant des tâches, qui exploite les connaissances symboliques spécifiques à un domaine, intégrées dans des ontologies, pour explorer plus efficacement le contenu complexe d'un domaine. StructSense intègre une boucle de rétroaction pour une amélioration itérative via des juges auto-évaluateurs et un mécanisme d'intervention humaine pour l'assurance qualité et la validation. En l'appliquant à une tâche d'extraction d'informations en neurosciences, nous démontrons que StructSense surmonte deux limites : la sensibilité au domaine et le manque de généralisation inter-tâches.

Takeaways, Limitations

Takeaways:
Une nouvelle approche pour répondre aux problèmes de sensibilité du domaine et de transférabilité intertâches dans l'extraction d'informations structurées basée sur le LLM.
Améliorer les performances du LLM et étendre son applicabilité à des domaines spécialisés grâce à l’utilisation de connaissances basées sur l’ontologie.
Améliorer le contrôle qualité et la fiabilité grâce à des mécanismes d’auto-évaluation et d’intervention humaine.
Amélioration de l'efficacité de la recherche et du développement en fournissant un cadre open source modulaire et indépendant des tâches.
Limitations:
Une validation supplémentaire est nécessaire pour déterminer la généralisabilité du cadre proposé à d’autres domaines et tâches.
La difficulté et le coût du développement et de la gestion de l’ontologie.
L’automatisation complète peut s’avérer difficile car certaines parties nécessitent une intervention humaine.
Dégradation possible des performances de généralisation en raison de l'utilisation d'ontologies biaisées en faveur de domaines spécifiques.
👍