OpenCodeEdit es una canalización de código abierto que sintetiza tripletas realistas de edición de código aprovechando múltiples LLM para la edición de código, una tarea crucial en la ingeniería de software. Esta canalización genera tanto instrucciones concisas "perezosas" como instrucciones "descriptivas" más detalladas, y aplica diffs y filtrado basado en temas para garantizar la calidad y diversidad de los datos. Esto dio como resultado la creación de OCEDataFT, un conjunto de datos depurado de 20 000 muestras. El ajuste de tres modelos de referencia avanzados en OCEDataFT mejoró significativamente el rendimiento en la prueba de referencia CanItEdit, con una mejora relativa en pass@1 del 4,50 % al 20,79 %. Cabe destacar que el modelo generado alcanzó un rendimiento cercano al de un sistema cerrado, reduciendo la diferencia con GPT-4 en un 3,54 % sin requerir recursos propietarios ni anotación manual.