Bài báo này nhấn mạnh rằng các mô hình dựa trên Transformer vẫn còn thiếu tính tổng quát và khả năng thích ứng cần thiết cho sự phối hợp giữa con người và AI. Bằng cách xem xét những điểm yếu trong nhiệm vụ ARC-AGI, chúng tôi phát hiện ra những khác biệt trong khái quát hóa mang tính xây dựng và khả năng thích ứng quy tắc mới, và lập luận rằng việc giải quyết những khoảng trống này đòi hỏi một quy trình suy luận được cải tiến và đánh giá của nó. Chúng tôi đề xuất ba hướng nghiên cứu: một quy trình biểu diễn biểu tượng cho tính tổng quát mang tính xây dựng, một vòng lặp suy luận dựa trên phản hồi tương tác cho khả năng thích ứng, và tăng cường tác vụ trong thời gian thử nghiệm cân bằng cả hai đặc điểm. Cuối cùng, chúng tôi chứng minh cách các công cụ đánh giá của ARC-AGI có thể được sử dụng để theo dõi tiến trình về tính tổng quát biểu tượng, khả năng thích ứng dựa trên phản hồi và độ mạnh mẽ ở cấp độ tác vụ, từ đó định hướng cho các nghiên cứu trong tương lai về sự phối hợp mạnh mẽ giữa con người và AI.