SToFM es un novedoso modelo de base para analizar datos de transcriptomas espaciales multiescala. Se propone resolver la dificultad de extraer información multiescala (morfología tisular macroscópica, microambiente celular microscópico y perfil de expresión génica a nivel génico) de datos de transcriptomas espaciales masivos y complejos. SToFM realiza la extracción de información multiescala para cada corte ST para construir un conjunto de subcortes ST que agregan información macroscópica, microscópica y a escala génica. Luego, utiliza SE(2) Transformer para obtener representaciones celulares de alta calidad de los subcortes. Además, construimos SToCorpus-88M , el corpus de transcriptomas espaciales de alta resolución más grande para preentrenamiento . Logra un excelente rendimiento en varias subtareas, como la segmentación semántica de la región tisular y la anotación del tipo de célula, lo que demuestra una comprensión integral de los datos ST a través de la captura e integración de información multiescala.