Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

ALLoyM: Un modelo de lenguaje amplio para la predicción de diagramas de fases de aleación

Created by
  • Haebom

Autor

Yuna Oikawa, Guillaume Deffrennes, Taichi Abe, Ryo Tamura, Koji Tsuda

Describir

Este artículo presenta aLLoyM, un modelo de lenguaje a gran escala (LLM) aplicable a la ciencia de los materiales. aLLoyM es un LLM específicamente optimizado para la composición de aleaciones, la temperatura y la información de fase correspondiente. Se desarrolló mediante la selección de pares de preguntas y respuestas (Q&A) para diagramas de fase binarios y ternarios, basados en la Base de Datos de Diagramas de Fase Computacionales (CPDDB) de código abierto y el Cálculo de Diagramas de FASE (CALPHAD). Se afinó Mistral, un LLM preentrenado de código abierto, en dos formatos de preguntas y respuestas: opción múltiple y respuesta corta. Los resultados de la evaluación comparativa demuestran que el ajuste mejora significativamente el rendimiento en preguntas de diagrama de fase de opción múltiple. Además, el modelo de respuesta corta de aLLoyM demuestra su capacidad para generar nuevos diagramas de fase basados únicamente en elementos constituyentes, lo que destaca su potencial para acelerar el descubrimiento de sistemas de materiales previamente inexplorados. Para fomentar una mayor investigación y adopción, hemos publicado la versión optimizada de respuestas cortas de aLLoyM y el conjunto completo de datos de preguntas y respuestas de evaluación comparativa sobre Hugging Face.

Takeaways, Limitations

Takeaways:
Desarrollamos un modelo que se puede aplicar eficazmente para resolver problemas en ciencia de materiales utilizando LLM de código abierto.
ALLoyM funciona bien tanto en preguntas de opción múltiple como de respuesta corta, y el modelo de respuesta corta en particular demuestra su capacidad para generar nuevos diagramas de fases.
Incentivamos una mayor investigación y uso haciendo públicos los modelos y conjuntos de datos desarrollados.
Ofrece el potencial de acelerar el descubrimiento de nuevos sistemas materiales.
Limitations:
Actualmente, se entrena únicamente utilizando datos de diagramas de fase binarios y ternarios, por lo que su aplicabilidad a sistemas más complejos puede ser limitada.
Se necesitan más evaluaciones y validaciones de la precisión del modelo y del rendimiento de generalización.
Existe una dependencia de la precisión e integridad de los datos que dependen de CPDDB y CALPHAD.
👍