Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Raisonnement abductif basé sur la cohérence sur les erreurs de perception de plusieurs modèles pré-entraînés dans de nouveaux environnements

작성자
  • Haebom

Auteur

Mario Leiva, Noel Ngu, Joshua Shay Kricheli, Aditya Taparia, Ransalu Senanayake, Paulo Shakarian, Nathaniel Bastian, John Corcoran, Gerardo Simari

Contour

Cet article aborde le problème de la dégradation des performances due aux changements distributionnels qui surviennent lors de l'application de modèles de reconnaissance pré-entraînés à de nouveaux environnements. Les approches métacognitives existantes utilisent des règles logiques pour caractériser et filtrer les erreurs de modèle, mais l'amélioration de la précision se fait souvent au détriment d'une diminution du rappel. Cet article émet l'hypothèse que l'exploitation de plusieurs modèles pré-entraînés peut atténuer cette dégradation du rappel. Nous formulons le problème de l'identification et de la gestion des prédictions contradictoires issues de différents modèles comme un problème d'inférence inductive basé sur la cohérence, en nous appuyant sur les concepts de l'apprentissage adaptatif (ABL), mais en l'appliquant au moment du test plutôt qu'à celui de l'apprentissage. Les prédictions d'entrée et les règles de détection d'erreur apprises, dérivées de chaque modèle, sont codées dans un programme logique. Nous trouvons ensuite une explication inductive (un sous-ensemble de prédictions du modèle) qui maximise la couverture des prédictions tout en maintenant le taux de divergence logique (dérivé des contraintes du domaine) en dessous d'un seuil spécifié. Nous proposons deux algorithmes pour cette tâche de représentation des connaissances : une méthode exacte basée sur la programmation en nombres entiers (PI) et une recherche heuristique efficace (HS). Des expériences approfondies sur des jeux de données d'imagerie aérienne simulés présentant des variations distributionnelles complexes et contrôlées démontrent que notre cadre d'inférence inductive basé sur la cohérence surpasse à la fois les modèles individuels et les ensembles de référence standard, avec une amélioration d'environ 13,6 % du score F1 et de 16,6 % de la précision par rapport au meilleur modèle individuel sur 15 jeux de données tests différents. Ces résultats démontrent que l'inférence inductive basée sur la cohérence peut être utilisée comme un mécanisme efficace pour intégrer de manière robuste les connaissances issues de multiples modèles imparfaits dans de nouveaux scénarios complexes.

Takeaways, Limitations

Takeaways:
Nous présentons un nouveau cadre qui intègre les prédictions de plusieurs modèles pré-entraînés grâce à une inférence inductive basée sur la cohérence.
Suggérant la possibilité de développer un modèle de reconnaissance robuste aux changements de distribution
Preuve d'applicabilité à diverses situations à travers deux algorithmes : la programmation en nombres entiers (PI) et la recherche heuristique (HS).
Amélioration des performances par rapport aux méthodes existantes sur les ensembles de données d'images aériennes simulées (amélioration de 13,6 % du score F1, amélioration de 16,6 % de la précision)
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer l’applicabilité de cette méthode aux environnements réels à l’aide d’ensembles de données simulés.
Dépendance à la définition et à la configuration des contraintes de domaine
Des recherches supplémentaires sont nécessaires sur la complexité de calcul et l’évolutivité de l’algorithme.
La vérification de la généralisabilité est nécessaire pour différents types de modèles de reconnaissance et d’ensembles de données.
👍