Los modelos modernos van más allá de simplemente reflejar el conocimiento del mundo; reflejan patrones de preferencia humana inherentes a los datos de entrenamiento. Planteamos la hipótesis de que la ordenación recursiva (mediante la retroalimentación humana y el corpus generado por el modelo) induce un sesgo de deseabilidad social, lo que provoca que el modelo favorezca las respuestas agradables o halagadoras sobre las inferencias objetivas. Denominamos a esto la "Hipótesis de Narciso" y la probamos en 31 modelos mediante evaluaciones de personalidad estandarizadas y una novedosa puntuación de sesgo de deseabilidad social. Los resultados revelaron un cambio significativo hacia la conformidad social, con implicaciones significativas para la integridad del corpus y la fiabilidad de las inferencias posteriores. También proponemos una novedosa interpretación epistemológica de cómo el sesgo recursivo altera las inferencias de orden superior en la escala causal de Pearl, lo que finalmente conduce a lo que denominamos la "etapa de ilusión".