Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage de la représentation multimodale des protéines hiérarchiques bidirectionnelles

Created by
  • Haebom

Auteur

Xuefeng Liu, Songhao Jiang, Chih-chan Tien, Jinbo Xu, Rick Stevens

Contour

Cet article propose un cadre d'apprentissage de la représentation protéique multimodale exploitant à la fois la séquence protéique et les informations structurales 3D. Il combine les atouts d'un modèle de langage protéique basé sur Transformer (pLM), pré-entraîné sur des données de séquences protéiques à grande échelle, et d'un réseau neuronal graphique (GNN) exploitant les informations structurales 3D. Ce cadre permet un échange d'informations efficace entre les deux modalités grâce à des mécanismes d'attention et de gating. Plus précisément, une approche de fusion bihiérarchique améliore l'intégration des informations de séquence et de structure aux niveaux local et global. La méthode proposée surpasse les méthodes existantes sur divers critères d'apprentissage de la représentation protéique, notamment la classification des CE enzymatiques, l'évaluation de la qualité des modèles, la prédiction de l'affinité de liaison protéine-ligand, la prédiction du site de liaison protéine-protéine et la prédiction de l'épitope des lymphocytes B, constituant ainsi un nouvel état de l'art dans le domaine de l'apprentissage de la représentation protéique multimodale.

Takeaways, Limitations

Takeaways:
Un nouveau cadre de fusion bi-hiérarchique pour une fusion efficace des informations sur la séquence et la structure des protéines est présenté.
Amélioration des performances par rapport aux méthodes existantes dans diverses tâches de prédiction liées aux protéines.
Atteindre un nouvel état de l’art dans l’apprentissage de la représentation multimodale des protéines.
ÉChange d'informations et renforcement mutuel entre les modalités par le biais de mécanismes d'attention et de mécanismes de contrôle.
Limitations:
Cet article ne traite pas spécifiquement de Limitations. Les recherches futures pourraient nécessiter d'évaluer les performances de généralisation et d'optimiser les coûts de calcul sur divers ensembles de données de structure protéique.
👍