[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

THOR : Heuristiques de transformateur pour la récupération à la demande

Created by
  • Haebom

Auteur

Isaac Shi, Zeyuan Li, Fan Liu, Wenli Wang, Lewei He, Yang Yang, Tianyu Shi

Contour

Le module Transformer Heuristics for On-Demand Retrieval (THOR), développé par eSapiens, est un moteur sécurisé et évolutif qui transforme les questions en langage naturel en requêtes d'analyse SQL validées en lecture seule. Basé sur une architecture d'orchestration/exécution découplée, l'agent de supervision achemine les requêtes, la découverte de schémas injecte dynamiquement les métadonnées des tables et des colonnes, et l'agent de génération SQL génère des requêtes SELECT à instruction unique protégées par des protections en lecture seule. La boucle d'autocorrection et d'évaluation intégrée détecte les résultats vides, les erreurs d'exécution ou les sorties de mauvaise qualité et tente jusqu'à cinq fois une régénération basée sur LLM. Enfin, l'agent d'interprétation des résultats génère des informations concises et lisibles par l'utilisateur et transmet les lignes brutes au moteur Insights and Intelligence pour visualisation ou prédiction. Les tests de détection de fumée pour les scénarios financiers, commerciaux et opérationnels démontrent la fiabilité des requêtes ad hoc et la génération de rapports périodiques automatisés. Grâce à la reconnaissance des schémas, à l'exécution tolérante aux pannes et aux protections de conformité, le module THOR permet aux utilisateurs non techniques d'accéder en toute sécurité aux données en temps réel sans SQL.

Takeaways, Limitations_

Takeaways:
Traduisez les questions en langage naturel en requêtes SQL pour améliorer l'accessibilité des données pour les utilisateurs non techniques.
Améliorez la sécurité des données avec une protection en lecture seule.
Augmente la fiabilité de l'exécution des requêtes grâce à des boucles d'autocorrection et d'évaluation.
Applicable à divers scénarios commerciaux (finances, ventes, opérations).
Fournit des capacités de reporting périodique automatisées.
Limitations:
En raison des limitations de la régénération basée sur LLM, la précision de certaines questions complexes peut être réduite.
Les performances du système peuvent dépendre de la précision de la reconnaissance du schéma.
Une validation supplémentaire des performances et de l’évolutivité sur de grands ensembles de données est nécessaire.
Manque d'informations sur la variété des types de bases de données et des schémas actuellement pris en charge.
La stabilité à long terme et la maintenance dans des environnements d’exploitation réels doivent être examinées.
👍