Chúng tôi đặt mục tiêu phát triển một mô hình khớp lệnh lập thể tổng quát hóa, có thể hoạt động mà không cần tinh chỉnh từng tập dữ liệu cụ thể trên nhiều độ phân giải và chênh lệch khác nhau. Các phương pháp tìm kiếm cục bộ lặp hiện có đạt điểm cao trên một tập hợp điểm chuẩn hạn chế, nhưng thiếu tính nhất quán toàn cục, hạn chế khả năng tổng quát hóa. Mặt khác, về mặt lý thuyết, các kiến trúc khớp lệnh toàn cục mạnh hơn, nhưng chi phí tính toán và yêu cầu bộ nhớ cao khiến chúng không thực tế. Trong bài báo này, chúng tôi trình bày một kiến trúc khớp lệnh toàn cục mới, được gọi là $S^2M^2$, đạt được cả độ chính xác tiên tiến và hiệu suất cao mà không cần dựa vào bộ lọc khối lượng chi phí hoặc các ngăn xếp tăng cường sâu. Kiến trúc này tích hợp một bộ biến đổi đa độ phân giải để có đáp ứng tầm xa mạnh mẽ và một hàm mất mát mới tập trung xác suất vào các kết quả khớp lệnh khả thi để ước tính đồng thời chênh lệch, che khuất và độ tin cậy một cách mạnh mẽ hơn. Kiến trúc này đạt được hiệu suất tiên tiến trên các điểm chuẩn Middlebury v3 và ETH3D, tái tạo các chi tiết chất lượng cao với hiệu suất cạnh tranh.