Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
PDeepPP est un framework d'apprentissage profond intégré qui intègre un modèle de langage protéique pré-entraîné et une architecture hybride transformateur-convolution, permettant une identification robuste d'un large éventail de caractéristiques peptidiques. Il extrait systématiquement les caractéristiques de séquences globales et locales en organisant de vastes ensembles de données de référence et en mettant en œuvre des stratégies pour corriger le déséquilibre des données. Des analyses approfondies, incluant la réduction de la dimensionnalité et des études comparatives, démontrent la robustesse et l'interprétabilité des représentations peptidiques de PDeepPP, atteignant des performances de pointe sur 25 des 33 tâches d'identification biologique. Plus précisément, il atteint une grande précision dans l'identification des antibactériens (0,9726) et des sites de phosphorylation (0,9984), une spécificité de 99,5 % dans la prédiction des sites de glycosylation et réduit significativement les faux négatifs dans les tâches antipaludiques. En permettant une analyse peptidique précise et à grande échelle, PDeepPP soutient la recherche biomédicale et la découverte de nouvelles cibles thérapeutiques pour le traitement des maladies. Tous les codes, ensembles de données et modèles pré-entraînés sont disponibles publiquement sur GitHub ( https://github.com/fondress/PDeepPP ) et Hugging Face ( https://huggingface.co/fondress/PDeppPP) .
Fournit une identification robuste et précise de diverses fonctions peptidiques et sites PTM.
◦
Obtenez des performances de pointe dans une variété de tâches biologiques, notamment l'identification des sites antimicrobiens, de phosphorylation et de glycosylation.
◦
Nous présentons une stratégie pour résoudre efficacement les problèmes de déséquilibre des données.
◦
Il présente un grand potentiel pour contribuer à la recherche biomédicale et au développement de nouveaux médicaments.
◦
Tous les codes, données et modèles sont accessibles au public et hautement accessibles.
•
Limitations:
◦
Les performances de pointe n’ont pas été atteintes dans huit des 33 tâches, ce qui indique des domaines d’amélioration future.
◦
Ce document ne fournit pas de détails précis sur Limitations. Des analyses et vérifications supplémentaires peuvent être nécessaires.