Bài báo này định nghĩa ba thách thức của ước lượng kích thước tập dựa trên học máy (tính tổng quát, tính chính xác và khả năng cập nhật) là "Thế lưỡng nan tam giác của ước lượng kích thước tập" và đề xuất DistJoin, một bộ ước lượng kích thước tập hợp kết hợp hiệu quả, dựa trên phân phối, sử dụng mô hình hồi quy đa tự động. DistJoin sử dụng riêng các phân phối xác suất của từng bảng để ước lượng kích thước tập hợp kết hợp và đạt được hiệu quả thông qua Điều chế Vị từ Nơ-ron Thích ứng (ANPM), một mô hình ước lượng phân phối thông lượng cao. Hơn nữa, chúng tôi chính thức giải quyết vấn đề tích lũy phương sai của các phương pháp tương tự hiện có thông qua phân tích phương sai và giảm phương sai hiệu quả thông qua phương pháp dựa trên tính chọn lọc. DistJoin là phương pháp dựa trên dữ liệu đầu tiên hỗ trợ cả kết hợp bằng nhau và không bằng nhau, mang lại độ chính xác cao và cập nhật nhanh chóng, linh hoạt. Kết quả thử nghiệm cho thấy DistJoin đạt được độ chính xác, độ tin cậy cao nhất đối với các bản cập nhật dữ liệu và tính tổng quát so với các phương pháp hiện có, đồng thời chứng minh tốc độ cập nhật và suy luận tương đương.