Bài báo này đề xuất Bộ chuyển đổi Quyết định Nhanh Tiến bộ (P2DT) như một giải pháp cho vấn đề quên quan trọng, gây ra sự suy giảm hiệu suất khi gặp phải các tác vụ mới trong các tác nhân thông minh được điều khiển bởi các mô hình quy mô lớn. P2DT thúc đẩy các chính sách cụ thể cho từng tác vụ bằng cách thêm động các mã thông báo quyết định trong quá trình học tác vụ mới, cải thiện mô hình dựa trên Bộ chuyển đổi. Điều này giúp giảm thiểu tình trạng quên trong cả các tình huống học tăng cường liên tục và ngoại tuyến. Hơn nữa, P2DT sử dụng các quỹ đạo được thu thập thông qua học tăng cường hiện có trên tất cả các tác vụ và tạo ra các mã thông báo cụ thể cho tác vụ mới trong quá trình học, bảo toàn kiến thức từ quá trình học trước đó. Kết quả ban đầu chứng minh rằng mô hình này giảm thiểu hiệu quả tình trạng quên quan trọng và có khả năng mở rộng tốt trong môi trường tác vụ ngày càng tăng.