Các chuẩn mực Lý thuyết Tâm trí (ToM) hiện có dựa trên các biến thể của bài kiểm tra Sally-Anne, chỉ cung cấp một góc nhìn rất hạn chế về ToM và bỏ qua sự phức tạp của tương tác xã hội của con người. Trong bài báo này, chúng tôi đề xuất một chuẩn mực mới, ToM-SSI, được thiết kế đặc biệt để kiểm tra khả năng ToM trong các môi trường giàu tương tác xã hội và động lực không gian. Trong khi các chuẩn mực ToM hiện có bị giới hạn ở các tương tác chỉ bằng văn bản hoặc tương tác hai chiều, ToM-SSI là đa phương thức và bao gồm các tương tác nhóm gồm tối đa bốn tác nhân di chuyển trong một môi trường tương tác và nhạy cảm với ngữ cảnh. Thiết kế độc đáo này cho phép chúng tôi khám phá bối cảnh hỗn hợp can thiệp hợp tác và suy luận song song về trạng thái tinh thần của nhiều tác nhân lần đầu tiên, nắm bắt được phạm vi nhận thức xã hội rộng hơn so với các chuẩn mực hiện có. Đánh giá của chúng tôi cho thấy hiệu suất của mô hình hiện tại vẫn còn rất hạn chế, đặc biệt là đối với các nhiệm vụ mới này, làm nổi bật những khoảng trống quan trọng cho các nghiên cứu trong tương lai.