Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Structurer le non structuré : un système multi-agents pour extraire et interroger les indicateurs clés de performance (KPI) et les orientations financières

Created by
  • Haebom

Auteur

Chanyeol Choi, Alejandro Lopez-Lira, Yongjae Lee, Jihoon Kwon, Minjae Kim, Juneha Hwang, Minsoo Ha, Chaewoon Kim, Jaeseon Ha, Suyeol Yun, Jin Kim

Contour

Cet article propose une méthode efficace et évolutive pour extraire des informations structurées et quantitatives à partir de rapports financiers non structurés. À l'aide d'un système multi-agents basé sur un modèle de langage à grande échelle, l'agent d'extraction identifie automatiquement les indicateurs clés de performance (KPI), standardise leurs formats et vérifie leur exactitude, tandis que l'agent Text-to-SQL génère des instructions SQL exécutables à partir de requêtes en langage naturel, permettant aux utilisateurs d'accéder avec précision aux données structurées sans connaître le schéma de la base de données. Les résultats expérimentaux démontrent que le système proposé est efficace pour convertir avec précision du texte non structuré en données structurées et pour récupérer avec précision les informations clés. Il atteint une précision d'environ 95 % pour la conversion de rapports financiers en données structurées et de 91 % pour les tâches de recherche d'informations à l'aide de requêtes en langage naturel.

Takeaways, Limitations

Takeaways:
Nous présentons une nouvelle approche permettant d’extraire de manière efficace et évolutive des informations quantitatives à partir de rapports financiers non structurés.
Utilisation efficace de systèmes multi-agents basés sur des modèles de langage à grande échelle.
La transformation des données et la récupération des informations sont possibles avec une précision de niveau humain (environ 95 %).
Hautes performances de généralisation sur une large gamme de types de documents financiers.
L'accès aux données via des requêtes en langage naturel permet de récupérer des informations sans connaissances spécialisées.
Limitations:
Il se peut que le document ne contienne pas de description de l’architecture spécifique du système ni de détails de mise en œuvre.
Il peut y avoir un manque de description détaillée des types et des caractéristiques des modèles linguistiques à grande échelle utilisés.
Les informations détaillées sur l’échelle et la diversité des données expérimentales peuvent être limitées.
Des recherches supplémentaires sont nécessaires sur l’application du système et l’évaluation des performances dans des environnements de marché financier réels.
Une évaluation de la robustesse pour la gestion des erreurs et les situations d’exception est requise.
👍