Cet article présente TabSketchFM, un modèle de table basé sur un réseau neuronal, qui répond au besoin croissant des entreprises d'identifier les tables connexes (tables pouvant être réunies, jointes ou constituant des sous-ensembles les unes des autres) dans leurs lacs de données. TabSketchFM améliore l'efficacité de la découverte de données des modèles de tables neuronales grâce à une méthode de pré-entraînement basée sur des croquis et affine le modèle pré-entraîné pour identifier les paires de tables pouvant être réunies, jointes et constituant des sous-ensembles. Il démontre des améliorations significatives des performances par rapport aux modèles de tables neuronales existants et met en évidence les croquis essentiels à chaque tâche grâce à des études d'ablation détaillées. De plus, le modèle affiné est utilisé pour effectuer une recherche de table (tâche consistant à trouver d'autres tables dans le pool de données pouvant être réunies, jointes ou constituant des sous-ensembles d'une table de requête), démontrant une amélioration significative des scores F1 par rapport aux techniques de pointe. Enfin, nous démontrons la généralisabilité du modèle en démontrant des performances significatives d'apprentissage par transfert sur divers ensembles de données et tâches.