Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

UniGenX : un modèle de fondation génératif unifié qui associe séquence, structure et fonction pour accélérer la conception scientifique des protéines, des molécules et des matériaux

Created by
  • Haebom

Auteur

Gongbo Zhang, Yanting Li, Renqian Luo, Pipi Hu, Yang Yang, Zeru Zhao, Lingbo Li, Guoqing Liu, Zun Wang, Ran Bi, Kaiyuan Gao, Liya Guo, Yu Xie, Chang Liu, Jia Zhang, Tian Xie, Robert Pinsler, Claudio Zeni, Ziheng Lu, Hongxia Hao, Yingce Wen-Bin Zhang, Zhijun Zeng, Yi Zhu, Li Dong, Xiuyuan Hu, Li Yuan, Lei Chen, Haiguang Liu, Tao Qin

Contour

UniGenX est un framework génératif intégré qui cogénère des séquences unidimensionnelles et des coordonnées tridimensionnelles en ciblant directement les fonctions et propriétés de divers domaines, notamment les protéines, les molécules et les matériaux. Pour pallier le manque de ciblage direct des caractéristiques (qui est Limitations) dans les modèles génératifs existants, l'optimisation indépendante des séquences discrètes et des coordonnées continues, et la modélisation insuffisante des ensembles conformationnels, il représente les entrées hétérogènes sous forme d'un flux mixte de jetons symboliques et numériques, fournit un contexte global grâce à un transformateur autorégressif spécifique au décodeur et génère des champs numériques contrôlés par des jetons d'opération spécifiques via une tête de diffusion conditionnelle. Outre ses performances inégalées dans les tâches de prédiction de structure, il démontre également des performances de pointe, voire compétitives, pour la génération sensible aux caractéristiques dans les domaines des matériaux, de la chimie et de la biologie. Plus précisément, dans le domaine des matériaux, il a généré 436 candidats cristaux satisfaisant trois contraintes (dont 11 sont de nouvelles compositions). En chimie, il établit une nouvelle référence pour la génération de cinq cibles caractéristiques et d'ensembles de stéréoisomères dans GEOM. Enfin, en biologie, il améliore de plus de 23 fois le taux de réussite de la modélisation par ajustement guidé par les protéines. En conclusion, nos résultats expérimentaux démontrent les avantages de l'apprentissage conjoint discret-continu et des avancées significatives en matière de contrôlabilité prédictive et de génération de reconnaissance de caractéristiques grâce à l'apprentissage par transfert interdomaine.

Takeaways, Limitations

Takeaways:
Nous présentons un modèle génératif intégré qui cible directement les fonctions et les propriétés dans divers domaines tels que les protéines, les molécules et les matériaux.
Remédier au manque de ciblage direct de la fonction __T108_____ des modèles existants, à l'optimisation indépendante des séquences discrètes et des coordonnées continues, et à la modélisation insuffisante des ensembles morphologiques.
Atteignez des performances de pointe ou compétitives dans les tâches de prédiction structurelle et de génération de reconnaissance de caractéristiques.
Améliorations significatives des performances dans les matériaux, la chimie et la biologie (par exemple, amélioration > 23x du taux de réussite de la modélisation de l'ajustement induit par les protéines).
Démonstration expérimentale de l'efficacité de l'entraînement conjoint discret-continu.
Démontre le potentiel d’apprentissage par transfert interdomaine.
Limitations:
L'article ne mentionne pas spécifiquement Limitations. Des recherches futures devraient améliorer les performances du modèle et élargir son champ d'application.
👍