Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprendizaje de representación multimodal de proteínas jerárquicas bidireccionales

Created by
  • Haebom

Autor

Xuefeng Liu, Songhao Jiang, Chih-chan Tien, Jinbo Xu, Rick Stevens

Describir

Este artículo propone un marco de aprendizaje multimodal de representación de proteínas que aprovecha tanto la secuencia de proteínas como la información estructural 3D. Combina las ventajas de un modelo de lenguaje de proteínas (pLM) basado en Transformer, preentrenado con datos de secuencias de proteínas a gran escala, y una red neuronal de grafos (GNN) que aprovecha la información estructural 3D. Este marco permite un intercambio eficaz de información entre ambas modalidades mediante mecanismos de atención y activación. En concreto, un enfoque de fusión bijerárquica mejora la integración de la información de secuencia y estructural tanto a nivel local como global. El método propuesto supera a los métodos existentes en diversos parámetros de aprendizaje de representación de proteínas, como la clasificación de EC enzimáticos, la evaluación de la calidad del modelo, la predicción de la afinidad de unión proteína-ligando, la predicción del sitio de unión proteína-proteína y la predicción de epítopos de células B, lo que supone un nuevo hito en el campo del aprendizaje multimodal de representación de proteínas.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo marco de fusión bijerárquica para la fusión efectiva de la secuencia de proteínas y la información estructural.
Rendimiento mejorado respecto a los métodos existentes en diversas tareas de predicción relacionadas con proteínas.
Logrando un nuevo estado del arte en el aprendizaje de la representación multimodal de proteínas.
Intercambio de información y refuerzo mutuo entre modalidades a través de mecanismos de atención y mecanismos de control.
Limitations:
Este artículo no aborda específicamente Limitations. Investigaciones futuras podrían requerir la evaluación del rendimiento de generalización y la optimización de los costos computacionales en diversos conjuntos de datos de estructura de proteínas.
👍