Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Forêt aléatoire raffinée et consciente de la diversité

Created by
  • Haebom

Auteur

Sijan Bhattarai, Saurav Bhandari, Girija Bhusal, Saroj Shakya, Tapendra Pandey

Contour

Dans cet article, nous proposons un nouveau classificateur de forêt aléatoire (RF) qui supprime les caractéristiques peu informatives et génère sélectivement des arbres non corrélés. Cette approche permet de résoudre les problèmes de coût d'inférence élevé et de redondance des modèles de la forêt aléatoire (RF), largement utilisée dans divers domaines pour ses performances de classification robustes. Le modèle proposé est amélioré de manière itérative en supprimant les caractéristiques peu informatives, en déterminant analytiquement le nombre de nouveaux arbres et en supprimant les arbres redondants grâce à un clustering basé sur la corrélation. Les résultats expérimentaux obtenus avec huit jeux de données de référence différents (binaires et multi-classes) montrent que le modèle proposé atteint une meilleure précision que le RF standard.

Takeaways, Limitations_

Takeaways:
Nous montrons que le coût d’inférence et la complexité du modèle des forêts aléatoires peuvent être réduits en supprimant les caractéristiques avec peu d’informations et les arbres avec une corrélation élevée.
Permet d'obtenir une précision de classification améliorée par rapport aux forêts aléatoires standard.
La méthode proposée démontre son applicabilité à divers ensembles de données.
Limitations:
Des expériences supplémentaires sont nécessaires pour déterminer si les améliorations de performances du modèle proposé sont cohérentes dans tous les ensembles de données.
Des recherches supplémentaires sont nécessaires sur la généralisabilité des critères permettant d’évaluer la corrélation entre les caractéristiques à faible contenu informatif et les arbres.
Manque d’analyse de la complexité computationnelle de la méthode proposée.
👍