Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ACMP: Truyền tin Allen-Cahn với lực hút và lực đẩy cho mạng nơ-ron đồ thị

Created by
  • Haebom

Tác giả

Yuelin Wang, Kai Yi, Xinliang Liu, Yu Quang Wang, Shi Jin

Phác thảo

Trong bài báo này, chúng tôi mô hình hóa việc truyền thông điệp nơ-ron, đơn vị trích xuất đặc trưng cơ bản cho dữ liệu có cấu trúc đồ thị, như một hệ thống hạt tương tác với các lực hút và đẩy và lực Allen-Cahn phát sinh từ mô hình chuyển pha. Động lực của hệ thống là một quá trình phản ứng-khuếch tán không nổ tách các hạt. Điều này dẫn đến việc truyền thông điệp Allen-Cahn (ACMP) cho mạng nơ-ron đồ thị, trong đó các lần lặp số của giải pháp hệ thống hạt cấu thành sự lan truyền truyền thông điệp. ACMP, có thể được triển khai đơn giản bằng cách sử dụng bộ giải ODE nơ-ron, có thể tăng độ sâu của mạng lên tới 100 lớp với giới hạn dưới hoàn toàn dương đã được chứng minh về mặt lý thuyết trên năng lượng Dirichlet. Do đó, chúng tôi cung cấp một mô hình sâu của GNN giúp giải quyết vấn đề phổ biến của GNN về việc làm mịn quá mức. Các GNN sử dụng ACMP đạt được hiệu suất tiên tiến nhất trên các tác vụ phân loại nút trong thế giới thực trên cả tập dữ liệu đồng nhất và không đồng nhất. Mã có thể được tìm thấy tại https://github.com/ykiiiiii/ACMP .

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng việc truyền tin Allen-Cahn (ACMP) có thể làm tăng đáng kể độ sâu của GNN, do đó giải quyết được vấn đề làm mịn quá mức.
ĐạT được hiệu suất tiên tiến nhất trong các tác vụ phân loại nút thực tế dựa trên việc triển khai đơn giản và cơ sở lý thuyết.
Bằng chứng lý thuyết về giới hạn dưới hoàn toàn dương cho năng lượng Dirichlet.
Limitations:
Cần phải phân tích thêm về chi phí tính toán và khả năng mở rộng của phương pháp đề xuất.
Cần có thêm các thí nghiệm để xác định hiệu suất tổng quát cho các cấu trúc đồ thị và nhiệm vụ khác nhau.
Có khả năng thiên vị đối với một số loại dữ liệu đồ thị nhất định.
👍