Bài báo này thách thức giả định phổ biến trong mô hình hóa thế giới rằng các quy luật nhân quả cơ bản là duy nhất và bất biến. Trên thực tế, do cửa sổ quan sát hẹp, các cơ chế cơ bản cố định thường xuất hiện dưới dạng các cơ chế nhân quả đang tiến hóa. Do đó, ngay cả những thay đổi nhỏ trong chính sách hoặc trạng thái môi trường cũng có thể làm thay đổi các cơ chế nhân quả được quan sát. Để giải quyết vấn đề này, bài báo này đề xuất một mô hình thế giới được gọi là **Đồ thị siêu nhân quả**, một biểu diễn thống nhất, tối thiểu mã hóa hiệu quả cách các cấu trúc nhân quả thay đổi tùy thuộc vào các trạng thái thế giới tiềm năng. Đồ thị siêu nhân quả bao gồm nhiều đồ thị con nhân quả, mỗi đồ thị được kích hoạt bởi một trạng thái siêu (trong không gian của các trạng thái tiềm năng). Dựa trên biểu diễn này, bài báo này trình bày một **Tác nhân tìm kiếm nhân quả** (1) xác định các trạng thái siêu kích hoạt mỗi đồ thị con, (2) khám phá các mối quan hệ nhân quả tương ứng thông qua chính sách can thiệp do sự tò mò thúc đẩy của tác nhân và (3) tinh chỉnh đồ thị siêu nhân quả theo từng bước thông qua quá trình khám phá do sự tò mò thúc đẩy và trải nghiệm của tác nhân. Các thí nghiệm về nhiệm vụ điều khiển cánh tay tổng hợp và robot chứng minh rằng phương pháp đề xuất nắm bắt mạnh mẽ các biến thể trong động lực nhân quả và khái quát hóa hiệu quả sang các bối cảnh chưa từng thấy trước đây.