Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Phân cụm đồ thị thiếu thuộc tính có thể mở rộng thông qua phân biệt lân cận

작성자
  • Haebom

Tác giả

Yaowen Hu, Wenxuan Tu, Yue Liu, Xinhang Wan, Junyi Yan, Taichun Chu, Xinwang Liu

Phác thảo

Bài báo này thảo luận về phân cụm đồ thị sâu (DGC), một phương pháp phân loại không giám sát các nút trong đồ thị thuộc tính thành nhiều cụm. Để giải quyết những thách thức của đồ thị thuộc tính trong thế giới thực, thường rất lớn và thiếu thuộc tính, chúng tôi đề xuất một phương pháp DGC mới, "Phân biệt láng giềng đa góc nhìn bổ sung (CMV-ND)". CMV-ND xử lý trước thông tin cấu trúc đồ thị thành nhiều góc nhìn một cách hoàn chỉnh và không dư thừa. Cụ thể, nó mở rộng hoàn toàn cấu trúc cục bộ của đồ thị thông qua tìm kiếm láng giềng đệ quy và loại bỏ sự dư thừa giữa các láng giềng có khoảng cách bước nhảy khác nhau thông qua chiến lược phân biệt láng giềng. Sau đó, nó xây dựng K+1 góc nhìn bổ sung từ các biểu diễn bước nhảy vi phân và các đặc trưng nút mục tiêu, đồng thời áp dụng các phương pháp phân cụm đa góc nhìn hoặc DGC hiện có. Kết quả thử nghiệm trên sáu tập dữ liệu đồ thị được sử dụng rộng rãi chứng minh rằng CMV-ND cải thiện đáng kể hiệu suất của nhiều phương pháp khác nhau.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp DGC hiệu quả cho các đồ thị thực tế gặp phải vấn đề thiếu thuộc tính và quy mô lớn.
Nó sử dụng hiệu quả và đầy đủ thông tin cấu trúc đồ thị thông qua các chiến lược tìm kiếm hàng xóm đệ quy và phân biệt hàng xóm.
Nó cung cấp hiệu suất được cải thiện thông qua khả năng tương thích với nhiều phương pháp DGC hiện có.
Chúng tôi kiểm chứng tính ưu việt của phương pháp đề xuất thông qua kết quả thực nghiệm.
Limitations:
Thiếu sự phân tích về độ phức tạp tính toán của phương pháp đề xuất.
Hiệu suất tổng quát cho nhiều loại cấu trúc đồ thị khác nhau vẫn chưa được xác minh đầy đủ.
Phân tích độ nhạy là cần thiết cho các thiết lập thông số cụ thể.
Có khả năng thiên vị đối với một số loại mẫu bỏ sót thuộc tính nhất định.
👍