Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
Cet article aborde le défi de la récupération de la structure des modèles de graphes causaux à partir de données observationnelles, une tâche cruciale mais complexe pour la découverte causale dans des scénarios scientifiques. La découverte causale existante, spécifique à un domaine, repose sur la validation d'experts ou l'analyse a priori pour améliorer la fiabilité, mais est limitée par le manque de ressources expertes. Cet article démontre le potentiel des modèles de langage à grande échelle (LLM) pour servir d'experts autonomes guidant l'apprentissage structurel basé sur les données. Cependant, l'inexactitude de l'inférence basée sur les LLM entrave l'intégration des LLM dans la découverte causale. Pour y remédier, nous proposons un cadre de découverte causale basé sur les LLM tolérant aux pannes. Ce mécanisme tolérant aux pannes est conçu autour de trois aspects : pendant le processus d'inférence basé sur les LLM, une stratégie d'incitation axée sur la précision restreint l'analyse causale à une plage fiable. Ensuite, le transfert des connaissances vers la structure aligne les énoncés causaux dérivés des LLM avec les interactions causales structurelles. Pendant le processus d'apprentissage de la structure, l'inexactitude a priori est corrigée en équilibrant l'ajustement aux données avec le respect des informations a priori dérivées des LLM. L'évaluation de huit structures causales réelles démontre que l'approche proposée, basée sur le modèle LLM, améliore la découverte causale basée sur les données et résiste aux informations a priori inexactes basées sur le modèle LLM. Le code est disponible à l'adresse https://github.com/tyMadara/LLM-CD .
Takeaways: Nous proposons un cadre de découverte causale tolérant aux pannes utilisant la méthode LLM pour améliorer la précision et l'efficacité de la découverte causale basée sur les données. Nous validons l'efficacité et la robustesse de la méthode proposée à l'aide d'ensembles de données réelles.
•
Limitations: La performance du cadre proposé dépend de celle du LLM, et des erreurs peuvent survenir en raison d'inférences inexactes tirées du LLM. Des recherches supplémentaires sont nécessaires pour déterminer sa capacité de généralisation à divers domaines et structures causales complexes. La performance peut varier selon le type et la taille du LLM utilisé.