Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Generación de moléculas controladas por modalidades cruzadas con un modelo de lenguaje de difusión

Created by
  • Haebom

Autor

Yunzhe Zhang, Yifei Wang, Khanh Vinh Nguyen, Pengyu Hong

Describir

Para superar las limitaciones del modelo de difusión de generación molecular basado en SMILES existente, que solo admite restricciones unimodales, este documento propone la Generación de Moléculas Controladas por Modalidad Cruzada con Modelo de Lenguaje de Difusión (CMCM-DLM), que admite restricciones multimodales y la adición de nuevas restricciones. CMCM-DLM aplica restricciones de varias modalidades, como estructuras moleculares y propiedades químicas, paso a paso agregando un Módulo de Control de Estructura (SCM) y un Módulo de Control de Propiedad (PCM) a un modelo de difusión preentrenado. El SCM establece el esqueleto molecular en la etapa inicial y el PCM afina las propiedades químicas de las moléculas generadas a valores objetivo en la etapa posterior. Los resultados experimentales demuestran la eficiencia y adaptabilidad de CMCM-DLM, lo que sugiere un avance significativo en la generación de moléculas en el campo del descubrimiento de nuevos fármacos.

Takeaways, Limitations

Takeaways:
Superamos las limitaciones de los modelos existentes al proponer un modelo de producción molecular que admite restricciones multimodales.
Presentamos un método eficiente para aprovechar modelos previamente entrenados agregando nuevas restricciones sin tener que volver a entrenarlos.
Prueba de su potencial de uso en la generación molecular en diversos campos, incluido el desarrollo de nuevos fármacos.
Implementación de funciones de control efectivas mediante la aplicación separada de módulos de control de estructura y características.
Limitations:
Se necesita más investigación sobre la aplicación de restricciones a modos distintos de los dos presentados (estructura molecular, propiedades químicas).
Es necesario evaluar el desempeño de generalización para moléculas de diversos tamaños y complejidades.
Se necesitan más investigaciones sobre la interpretabilidad y explicabilidad del modelo.
Se requiere evaluación del rendimiento y verificación de escalabilidad en conjuntos de datos a gran escala.
👍