Este artículo presenta TabSketchFM, un modelo de tablas basado en redes neuronales, para abordar la creciente necesidad empresarial de identificar tablas relacionadas (tablas que se pueden unir, unir o que son subconjuntos entre sí) en sus lagos de datos. TabSketchFM mejora la eficiencia del descubrimiento de datos de los modelos de tablas neuronales mediante un método de preentrenamiento basado en bocetos y perfecciona el modelo preentrenado para identificar pares de tablas que se pueden unir, unir y formar subconjuntos. Demuestra mejoras significativas de rendimiento con respecto a los modelos de tablas neuronales existentes y destaca los bocetos cruciales para cada tarea mediante estudios detallados de ablación. Además, el modelo perfeccionado se utiliza para realizar búsquedas de tablas (la tarea de encontrar otras tablas en el conjunto de datos que se pueden unir, unir o que son subconjuntos de una tabla de consulta), lo que demuestra una mejora significativa en las puntuaciones F1 en comparación con las técnicas más avanzadas. Finalmente, demostramos la generalización del modelo mediante un rendimiento significativo del aprendizaje por transferencia en diversos conjuntos de datos y tareas.