[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Modèles de fondation biomédicale multi-vues pour la prédiction des molécules-cibles et des propriétés

Created by
  • Haebom

Auteur

Parthasarathy Suryanarayanan, Yunguang Qiu, Shreyans Sethi, Diwakar Mahajan, Hongyang Li, Yuxin Yang, Elif Eyigoz, Aldo Guzman Saenz, Daniel E. Platt, Timothy H. Rumbell, Kenney Ng, Sanjoy Dey, Myson Burch, Bum Chul Kwon, Pablo Meyer, Feixiong Cheng, Jianying Hu, Joseph A. Morrone

Contour

Cet article se concentre sur les représentations moléculaires de haute qualité, essentielles au développement de modèles fondamentaux en recherche biomédicale. Alors que les études précédentes se concentraient sur des représentations uniques ou des vues moléculaires, MMELON (Multi-view Molecular Embedding with Late Fusion) présente un modèle multi-vues intégrant graphiques, images et texte. Chaque modèle à vue unique est pré-entraîné avec un jeu de données pouvant atteindre 200 millions de molécules, et le modèle multi-vues affiche des performances similaires au modèle à vue unique le plus performant. Il a été validé sur plus de 120 tâches, dont la solubilité moléculaire, les propriétés ADME et l'activité des récepteurs couplés aux protéines G (RCPG). 33 RCPG liés à la maladie d'Alzheimer ont été identifiés et des liants puissants ont été sélectionnés à partir du criblage de composés à l'aide du modèle multi-vues, validé par une modélisation basée sur la structure et l'identification de motifs de liaison clés.

Takeaways, Limitations

Takeaways:
Nous présentons un modèle basé sur la représentation moléculaire qui intègre plusieurs perspectives (graphiques, images et textes) et montre des performances plus robustes que les modèles à perspective unique.
Applicabilité démontrée à diverses tâches biomédicales grâce à une pré-formation utilisant un ensemble de données de plus de 200 millions de molécules.
Suggérer une utilisation potentielle dans la découverte de médicaments pour les récepteurs GPCR liés à la maladie d'Alzheimer et valider par une modélisation basée sur la structure.
Il possède une structure qui permet d'étendre facilement des méthodes d'expression supplémentaires.
Limitations:
Le fait que les performances du modèle multi-vues présenté dans cet article soient similaires à celles du modèle mono-vue le plus performant ne constitue pas forcément une nette amélioration. Des recherches supplémentaires sont nécessaires pour démontrer des améliorations de performances plus significatives.
ÉTant donné qu’il s’agit d’un résultat de vérification des performances pour un ensemble de données et une tâche spécifiques, les performances de généralisation pour d’autres ensembles de données ou tâches doivent être vérifiées par des recherches supplémentaires.
En raison du manque d’informations détaillées sur la composition et les caractéristiques spécifiques de l’ensemble de données de 200 millions de molécules utilisé, la reproductibilité et la généralisabilité doivent être revues.
👍