En este artículo, exploramos si el aprendizaje de diccionarios dispersos (AD), que se ha consolidado como un método eficaz para extraer conceptos semánticamente significativos de modelos lingüísticos a gran escala (LLM) entrenados con datos textuales, puede aplicarse a datos científicos de difícil interpretación humana, como los modelos basados en visión entrenados con imágenes de microscopía celular. Proponemos un método novedoso que combina un algoritmo de AD disperso, el aprendizaje iterativo de características de libros de códigos (ICFL), con un preprocesamiento de blanqueamiento de PCA derivado de datos de control. Esto recupera con éxito conceptos biológicamente significativos, como tipos celulares y variaciones genéticas, y revela cambios morfológicos sutiles causados por intervenciones interpretables por humanos, lo que sugiere una nueva y prometedora dirección para el descubrimiento científico mediante la interpretación mecanicista de imágenes biológicas.