Để Khắc phục những hạn chế của học trong ngữ cảnh (ICL) trong môi trường học tăng cường (RL), bài báo này đề xuất Bộ chuyển đổi Quyết định Tăng cường Truy xuất (RA-DT), sử dụng cơ chế bộ nhớ để chỉ truy xuất các đường dẫn một phần liên quan đến ngữ cảnh hiện tại từ kinh nghiệm trong quá khứ. RA-DT sử dụng thành phần tìm kiếm độc lập với miền, không yêu cầu đào tạo và hoạt động tốt hơn các phương pháp hiện có trong môi trường thế giới lưới, mô phỏng robot và trò chơi điện tử được tạo theo thủ tục. Đáng chú ý, nó đạt hiệu suất cao ngay cả với độ dài ngữ cảnh ngắn. Bài báo này xác định những hạn chế của các phương pháp ICL hiện có trong các môi trường phức tạp, đề xuất các hướng nghiên cứu trong tương lai và trình bày các tập dữ liệu cho bốn môi trường mà nó được sử dụng.