Assay2Mol es un flujo de trabajo a gran escala basado en modelos de lenguaje que aprovecha datos de texto no estructurado de ensayos de cribado bioquímico para generar moléculas candidatas para el descubrimiento de nuevos fármacos. Supera los enfoques tradicionales de aprendizaje automático basados en la estructura de proteínas diana y mejora la generación de moléculas sintetizables. Busca registros de ensayos existentes que contengan dianas similares y utiliza los datos de cribado recuperados para generar moléculas candidatas mediante aprendizaje contextual. Aprovecha bases de datos científicas que contienen texto técnico, junto con grandes cantidades de datos cuantitativos, para apoyar el descubrimiento de fármacos en las primeras etapas.