Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Prédiction robuste des propriétés moléculaires via la densification de données étiquetées rares

Created by
  • Haebom

Auteur

Jina Kim, Jeffrey Willette, Bruno Andreis, Sung Ju Hwang

Contour

Dans cet article, nous proposons une approche basée sur le méta-apprentissage pour résoudre le problème des faibles performances de généralisation des composés hors distribution, dû à une dépendance excessive aux données d'apprentissage, ce qui est Limitations des modèles de prédiction moléculaire existants. Les modèles d'apprentissage profond existants produisent des prédictions instables et inexactes pour des données dont les distributions diffèrent de celles des données d'apprentissage. Le manque de données dû à la difficulté de vérification expérimentale aggrave également les faibles performances de généralisation. Dans cette étude, nous proposons une méthode basée sur le méta-apprentissage qui interpole entre les données comprises dans la distribution des données d'apprentissage (ID) et les données hors distribution (OOD) en utilisant des données non étiquetées, afin que le modèle apprenne à généraliser au-delà de la distribution d'apprentissage. Nous démontrons une amélioration significative des performances sur des ensembles de données réels et démontrons l'efficacité de la méthode d'interpolation grâce à la visualisation t-SNE.

Takeaways, Limitations

Takeaways:
Nous proposons qu’une approche basée sur le méta-apprentissage peut améliorer les performances de généralisation des modèles de prédiction moléculaire pour les composés hors distribution.
Nous démontrons le potentiel d’atténuer les problèmes de pénurie de données en exploitant efficacement les données non étiquetées.
Nous démontrons la praticité de la méthode proposée en démontrant des performances améliorées dans des applications réelles.
Limitations:
Les performances de généralisation de la méthode proposée peuvent varier selon les ensembles de données.
Une analyse supplémentaire au-delà de la visualisation t-SNE peut être nécessaire.
Il existe un risque d’augmentation des coûts de calcul en raison de la complexité du méta-apprentissage.
👍