En este artículo, presentamos ExpliCa, un novedoso conjunto de datos para evaluar el razonamiento causal explícito. ExpliCa integra relaciones causales y temporales que se presentan en diversos órdenes lingüísticos y se expresan explícitamente como conectores lingüísticos. Incluye índices de aceptabilidad humana de colaboración abierta y se evalúa con respecto a siete LLM comerciales y de código abierto mediante métricas basadas en la incitación y la perplejidad. Nuestros resultados muestran que incluso los modelos mejor clasificados no alcanzan una precisión de 0,80, lo que sugiere que los modelos tienden a confundir las relaciones temporales y causales, y que el rendimiento se ve fuertemente afectado por el orden lingüístico de los eventos. También observamos que las puntuaciones basadas en la perplejidad y el rendimiento de la incitación se ven afectados de forma diferente por el tamaño del modelo.