Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Génération de molécules contrôlées par modalités croisées avec modèle de langage de diffusion

Created by
  • Haebom

Auteur

Yunzhe Zhang, Yifei Wang, Khanh Vinh Nguyen, Pengyu Hong

Contour

Pour surmonter les limites du modèle de diffusion de génération moléculaire basé sur SMILES existant, qui ne prend en charge que les contraintes monomodales, cet article propose un modèle de langage de génération de molécules contrôlées par modalités croisées avec diffusion (CMCM-DLM), qui prend en charge les contraintes multimodales et l'ajout de nouvelles contraintes. Le CMCM-DLM applique des contraintes de diverses modalités, telles que les structures moléculaires et les propriétés chimiques, par étapes en ajoutant un module de contrôle de structure (SCM) et un module de contrôle de propriété (PCM) à un modèle de diffusion pré-entraîné. Le SCM établit le squelette moléculaire au stade précoce, et le PCM ajuste les propriétés chimiques des molécules générées aux valeurs cibles au stade ultérieur. Les résultats expérimentaux démontrent l'efficacité et l'adaptabilité du CMCM-DLM, suggérant une avancée significative dans la génération de molécules dans le domaine de la découverte de nouveaux médicaments.

Takeaways, Limitations

Takeaways:
Nous surmontons les limites des modèles existants en proposant un modèle de production moléculaire prenant en charge les contraintes multimodales.
Nous présentons une méthode efficace pour exploiter les modèles pré-entraînés en ajoutant de nouvelles contraintes sans recyclage.
Preuve de son potentiel d’utilisation dans la génération moléculaire dans divers domaines, y compris le développement de nouveaux médicaments.
Mise en œuvre de fonctions de contrôle efficaces grâce à l'application séparée de modules de contrôle de structure et de caractéristiques.
Limitations:
Des recherches supplémentaires sont nécessaires sur l’application des contraintes à d’autres modes que les deux présentés (structure moléculaire, propriétés chimiques).
L’évaluation des performances de généralisation est nécessaire pour les molécules de différentes tailles et complexités.
Des recherches supplémentaires sont nécessaires sur l’interprétabilité et l’explicabilité du modèle.
Une évaluation des performances et une vérification de l’évolutivité sur des ensembles de données à grande échelle sont nécessaires.
👍