Este artículo propone un método novedoso para generar datos sintéticos tabulares realistas de forma rápida y rentable mediante modelos de lenguaje a gran escala (LLM). A diferencia de los métodos existentes que generan cada registro individualmente mediante LLM, lo cual requiere mucho tiempo y dinero, nuestro método infiere la distribución de cada campo mediante LLM y la codifica en un script de muestreo reutilizable. Al clasificar automáticamente el tipo de dato del campo (numérico, categórico y texto libre) y generar scripts basados en la distribución, podemos generar eficientemente conjuntos de datos a gran escala diversos y realistas sin necesidad de inferencia continua del modelo. Los resultados experimentales muestran que el método propuesto es superior a los métodos directos existentes en términos de diversidad y realismo de los datos, y reduce significativamente la carga que supone generar grandes cantidades de datos sintéticos. En el futuro, nuestro objetivo es aplicarlo para acelerar las pruebas de los procesos de producción, acortando así el ciclo de desarrollo y mejorando la eficiencia del sistema.