Bài báo này chỉ ra những hạn chế của các phương pháp dự đoán tỷ lệ nhấp chuột (CTR) hiện có, chủ yếu dựa trên phương thức ID và do đó không thể mô hình hóa toàn diện các sở thích đa dạng của người dùng. Chúng tôi đề xuất một khuôn khổ mới cho dự đoán CTR đa phương thức, đó là Mạng lưới Quan tâm Synergy Đa phương thức dựa trên Khuếch tán (Diff-MSIN). Diff-MSIN bao gồm ba mô-đun: Mô-đun Nâng cao Tính năng Đa phương thức (MFE), Mô-đun Ghi lại Mối quan hệ Synergistic (SRC) và Mô-đun Hợp nhất Thích ứng Động Tính năng (FDAF). Mỗi mô-đun tập trung vào việc trích xuất các điểm tương đồng, điểm chung và điểm khác biệt giữa các phương thức khác nhau, nắm bắt sở thích của người dùng và giảm nhiễu hợp nhất. Kết quả thử nghiệm sử dụng Rec-Tmall và ba tập dữ liệu Amazon cho thấy Diff-MSIN vượt trội hơn các phương pháp hiện có ít nhất 1,67%.