[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Preentrenamiento en dos etapas para la predicción de propiedades moleculares en la naturaleza

Created by
  • Haebom

Autor

Kevin Tirta Wijaya, Minghao Guo, Michael Sun, Hans-Peter Seidel, Wojciech Matusik, Vahid Babaei

Describir

En este artículo, proponemos MoleVers, un modelo molecular multiobjetivo preentrenado para predecir diversas características moleculares en entornos sin datos validados experimentalmente. MoleVers emplea una estrategia de preentrenamiento en dos etapas. En la primera, se aprenden representaciones moleculares a partir de datos no etiquetados mediante la predicción de átomos enmascarados y la eliminación de ruido extremo, gracias a una novedosa arquitectura de codificador ramificado y al muestreo dinámico de la escala de ruido. En la segunda etapa, estas representaciones se mejoran mediante predicciones de características auxiliares derivadas de métodos computacionales como la teoría del funcional de la densidad o modelos lingüísticos a gran escala. Los resultados de la evaluación en 22 pequeños conjuntos de datos validados experimentalmente muestran que MoleVers alcanza un rendimiento de vanguardia, lo que destaca la eficacia del marco de dos etapas para generar representaciones moleculares generalizables para diversas subcaracterísticas.

Takeaways, Limitations

Takeaways:
Presentamos MoleVers, un nuevo modelo capaz de predecir diversas propiedades moleculares utilizando datos experimentales limitados.
Demostrar la viabilidad de aprender representaciones moleculares con un excelente rendimiento de generalización a través de una estrategia de preentrenamiento de dos pasos.
Se presenta una estrategia eficaz de aprendizaje sin etiquetas a través de la predicción de átomos enmascarados y la eliminación de ruido extremo.
Validación de la utilidad de la predicción de características auxiliares utilizando varios métodos computacionales, incluida la teoría funcional de la densidad y modelos de lenguaje a gran escala.
Lograr un rendimiento de última generación en 22 conjuntos de datos experimentales.
Limitations:
El tamaño de los 22 conjuntos de datos utilizados es pequeño, por lo que es necesario verificar el rendimiento de generalización en conjuntos de datos grandes.
Se necesitan más investigaciones sobre la generalidad de la nueva arquitectura del codificador de rama y el muestreo de escala de ruido dinámico y su aplicabilidad a otros campos.
Problemas con el consumo de recursos computacionales debido al uso de teoría funcional densa computacionalmente costosa, etc.
Especializado en situaciones donde los datos experimentales son insuficientes y la ventaja de rendimiento es incierta respecto a los modelos existentes cuando existen suficientes datos experimentales.
👍