यह शोधपत्र "सेट आकार अनुमान की त्रिकोणीय दुविधा" (सामान्यता, सटीकता और अद्यतनीयता के बीच का समझौता) को परिभाषित करता है जो अधिगम-आधारित कार्डिनैलिटी अनुमान के व्यावहारिक अनुप्रयोग में बाधा डालती है। इस समस्या का समाधान करने के लिए, हम DistJoin प्रस्तुत करते हैं, जो एक कुशल, वितरण-आधारित जॉइन सेट आकार अनुमानक है जो एक बहु-स्वतःप्रगामी मॉडल का उपयोग करता है। DistJoin अलग-अलग तालिकाओं के प्रायिकता वितरणों को पृथक करके जॉइन सेट आकार का अनुमान लगाता है और दक्षता सुनिश्चित करने के लिए एक उच्च-थ्रूपुट वितरण अनुमान मॉडल, अनुकूली तंत्रिका विधेय मॉडुलन (ANPM) विकसित करता है। हम प्रसरण विश्लेषण के माध्यम से मौजूदा समान दृष्टिकोणों की प्रसरण संचय समस्या का औपचारिक रूप से समाधान करते हैं और चयनात्मकता-आधारित दृष्टिकोण के माध्यम से प्रसरण को प्रभावी ढंग से कम करते हैं। DistJoin सम- और अ-सम-जॉइन दोनों का समर्थन करने वाली पहली डेटा-संचालित विधि है, जो उच्च सटीकता, सुदृढ़ डेटा अद्यतन, सामान्यता, और तेज़, लचीली अद्यतन और अनुमान गति प्रदर्शित करती है। प्रायोगिक परिणाम दर्शाते हैं कि DistJoin, तुलनीय गति प्रदान करते हुए, मौजूदा विधियों की तुलना में उच्चतम सटीकता, मजबूती और व्यापकता प्राप्त करता है।