En este artículo, presentamos una metodología para la generación automática de un conjunto de datos de edición de imágenes a gran escala y de alta calidad, con el fin de abordar las limitaciones de los asistentes de edición de imágenes basados en modelos generativos que realizan la edición mediante comandos de lenguaje natural. Si bien los enfoques existentes tienen dificultades para obtener ejemplos de edición precisos a nivel de píxel, nuestra metodología genera automáticamente datos de tripletes de alta calidad (imágenes originales, comandos e imágenes editadas) mediante la evaluación directa de la conformidad con los comandos y los factores estéticos mediante modelos generativos disponibles públicamente y el validador Gemini. Aumentamos el tamaño del conjunto de datos 2,2 veces mediante técnicas de inversión y bootstrap composicional, y presentamos el conjunto de datos NHR-Edit, compuesto por 358 000 tripletes de alta calidad y un modelo Bagel-NHR-Edit optimizado basado en él. Las evaluaciones a gran escala entre conjuntos de datos muestran que el conjunto de datos y el modelo propuestos superan a otros conjuntos de datos y modelos disponibles públicamente.