Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Analyse comparative de modèles d'intégration moléculaire pré-entraînés pour l'apprentissage de la représentation moléculaire

Created by
  • Haebom

Auteur

Mateusz Praski, Jakub Adamczyk, Wojciech tchèque

Contour

Cet article compare et analyse 25 modèles de réseaux neuronaux pré-entraînés, largement utilisés dans la conception de médicaments chimiques et à base de petites molécules, à partir de 25 jeux de données. Des modèles présentant diverses modalités, architectures et stratégies de pré-entraînés ont été évalués dans un cadre comparatif équitable. À l'aide d'un modèle de test statistique bayésien hiérarchique, l'analyse a révélé que la quasi-totalité des modèles de réseaux neuronaux n'ont pas amélioré significativement leurs performances par rapport au modèle d'empreinte moléculaire ECFP de base. Seul le modèle CLAMP, basé sur l'empreinte moléculaire, a montré des améliorations de performances statistiquement significatives par rapport aux autres modèles. Ces résultats soulèvent des inquiétudes quant à la rigueur des études précédentes, et nous en analysons les causes, les solutions et les recommandations pratiques.

Takeaways, Limitations_

Takeaways : Souligne des inquiétudes quant à la rigueur des études antérieures évaluant les performances des modèles de réseaux neuronaux pré-entraînés et suggère des pistes d'amélioration. Réaffirme l'efficacité des modèles basés sur l'empreinte moléculaire. Fournit des recommandations pratiques pour les recherches futures.
Limitations: Les 25 modèles et 25 ensembles de données évalués dans cette étude peuvent ne pas représenter parfaitement toutes les possibilités. Les résultats peuvent varier si d'autres mesures d'évaluation ou ensembles de données sont utilisés. Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité des performances du modèle à des types spécifiques de molécules ou de propriétés chimiques spécifiques.
👍