En este artículo, proponemos DialogueForge, un marco para generar conversaciones entre humanos y chatbots, con el fin de abordar los desafíos de la investigación en IA conversacional. DialogueForge genera conversaciones similares a las de los chatbots con LLM de diversos tamaños (p. ej., GPT-4o, Llama, Mistral, etc.) utilizando indicaciones semilla extraídas de interacciones reales entre humanos y chatbots. Utilizamos técnicas de ajuste fino para mejorar el rendimiento de modelos de código abierto a pequeña escala y evaluamos la calidad de las conversaciones generadas mediante UniEval y GTEval. Los resultados experimentales muestran que, si bien los modelos propietarios a gran escala generan conversaciones más realistas, los modelos de código abierto a pequeña escala también pueden mejorarse significativamente mediante el ajuste fino. Sin embargo, generar conversaciones largas, naturales y consistentes sigue siendo un desafío para todos los modelos.