Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Correspondance des scores potentiels : élimination des biais lors de l'échantillonnage de structures moléculaires avec guidage par énergie potentielle

Created by
  • Haebom

Auteur

Liya Guo, Zun Wang, Chang Liu, Junzhe Li, Pipi Hu, Yi Zhu

Contour

Cet article aborde le fait que la moyenne d'ensemble des propriétés physiques d'une molécule est étroitement liée à sa distribution de structure moléculaire, et que l'échantillonnage de cette distribution constitue un défi fondamental en physique et en chimie. Les méthodes conventionnelles, telles que les simulations de dynamique moléculaire (MD) et l'échantillonnage par chaîne de Markov Monte Carlo (MCMC), peuvent être longues et coûteuses. Pour surmonter les limites des modèles de diffusion, qui se sont imposés comme des alternatives efficaces grâce à l'apprentissage de la distribution des données d'entraînement, nous proposons une méthode d'appariement de score de potentiel (PSM) qui utilise les gradients d'énergie potentielle pour guider les modèles génératifs. Le PSM ne nécessite pas de fonction d'énergie exacte et peut éliminer les biais dans les distributions d'échantillons, même lorsqu'il est entraîné avec des données limitées et biaisées. Nous démontrons que le PSM surpasse les modèles de pointe (SOTA) existants sur le modèle jouet couramment utilisé, le potentiel de Lennard-Jones (LJ), et sur les jeux de données MD17 et MD22 de grande dimension. Nous démontrons également que la distribution moléculaire générée par le PSM se rapproche étroitement de la distribution de Boltzmann par rapport aux modèles de diffusion conventionnels.

Takeaways, Limitations

Takeaways:
Nous démontrons qu’un échantillonnage efficace de la distribution de la structure moléculaire est possible même avec des données limitées et biaisées.
Une nouvelle méthode (PSM) est présentée pour surmonter les limites des modèles de diffusion existants.
Il présente également d’excellentes performances dans les problèmes de grande dimension.
Cela suggère la possibilité de réduire les coûts de calcul en éliminant le besoin d’une fonction énergétique précise.
Limitations:
Seuls les résultats d’évaluation pour le potentiel de Lennard-Jones et les ensembles de données MD17 et MD22 sont présentés, des recherches supplémentaires sont donc nécessaires sur la généralisabilité.
Des applications supplémentaires et des évaluations de performances pour des systèmes moléculaires complexes réels sont nécessaires.
Manque d’analyse de la complexité informatique et de l’évolutivité du PSM.
👍