Este artículo define los tres desafíos de la estimación del tamaño de conjuntos basada en el aprendizaje (generalidad, precisión y actualizabilidad) como el "Dilema Triangular de la Estimación del Tamaño de Conjuntos" y propone DistJoin, un estimador eficiente del tamaño de conjuntos de unión basado en la distribución que utiliza un modelo multiautorregresivo. DistJoin utiliza por separado las distribuciones de probabilidad de tablas individuales para estimar el tamaño del conjunto de unión y logra eficiencia mediante la Modulación Adaptativa de Predicados Neurales (ANPM), un modelo de estimación de distribución de alto rendimiento. Además, abordamos formalmente el problema de acumulación de varianza de enfoques similares existentes mediante el análisis de varianza y reducimos eficazmente la varianza mediante un enfoque basado en la selectividad. DistJoin es el primer método basado en datos que admite uniones equitativas y no equitativas, ofreciendo alta precisión y actualizaciones rápidas y flexibles. Los resultados experimentales muestran que DistJoin logra la mayor precisión, robustez a las actualizaciones de datos y generalidad en comparación con los métodos existentes, a la vez que demuestra velocidades de actualización e inferencia comparables.