Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

UniGenX: un modelo generativo unificado que combina secuencia, estructura y función para acelerar el diseño científico en proteínas, moléculas y materiales.

Created by
  • Haebom

Autor

Gongbo Zhang, Yanting Li, Renqian Luo, Pipi Hu, Yang Yang, Zeru Zhao, Lingbo Li, Guoqing Liu, Zun Wang, Ran Bi, Kaiyuan Gao, Liya Guo, Yu Xie, Chang Liu, Jia Zhang, Tian Xie, Robert Pinsler, Claudio Zeni, Ziheng Lu, Hongxia Hao, Yingce Wen-Bin Zhang, Zhijun Zeng, Yi Zhu, Li Dong, Xiuyuan Hu, Li Yuan, Lei Chen, Haiguang Liu, Tao Qin

Describir

UniGenX es un marco generativo integrado que cogenera secuencias unidimensionales y coordenadas tridimensionales mediante la identificación directa de funciones y propiedades en diversos dominios, incluyendo proteínas, moléculas y materiales. Para abordar la falta de identificación directa de características (Limitations) en los modelos generativos existentes, la optimización independiente de secuencias discretas y coordenadas continuas, y el modelado insuficiente de conjuntos conformacionales, representa entradas heterogéneas como un flujo mixto de tokens simbólicos y numéricos, proporciona contexto global mediante un transformador autorregresivo específico del decodificador y genera campos numéricos controlados por tokens de operación específicos mediante un cabezal de difusión condicional. Además de lograr un rendimiento excepcional en tareas de predicción de estructuras, también demuestra un rendimiento de vanguardia o competitivo para la generación con reconocimiento de características en materiales, química y biología. Específicamente, en materiales, generó 436 candidatos cristalinos que cumplen tres restricciones (11 de los cuales son composiciones novedosas); en química, establece un nuevo punto de referencia para cinco objetivos de características y la generación de conjuntos de estereoisómeros en GEOM; y en biología, mejora la tasa de éxito del modelado de ajuste guiado por proteínas en más de 23 veces. En conclusión, nuestros resultados experimentales demuestran los beneficios del entrenamiento conjunto discreto-continuo y avances significativos en la controlabilidad predictiva y la generación de reconocimiento de características mediante el aprendizaje por transferencia entre dominios.

Takeaways, Limitations

Takeaways:
Presentamos un modelo generativo integrado que apunta directamente a funciones y propiedades en diversos campos, como proteínas, moléculas y materiales.
Abordar la falta de orientación directa para la función __T420_____ en los modelos existentes, la optimización independiente de secuencias discretas y coordenadas continuas y el modelado insuficiente de conjuntos morfológicos.
Lograr un desempeño de última generación o competitivo en tareas de generación de predicción estructural y reconocimiento de características.
Mejoras significativas del rendimiento en materiales, química y biología (p. ej., mejora >23x en la tasa de éxito del modelado de ajuste inducido por proteínas).
Demostración experimental de la eficacia del entrenamiento articular discreto-continuo.
Demuestra el potencial para el aprendizaje por transferencia entre dominios.
Limitations:
El artículo no menciona específicamente Limitations. Se espera que futuras investigaciones mejoren el rendimiento del modelo y amplíen su ámbito de aplicación.
👍