CAREL (Học Tăng cường Phụ trợ Liên phương thức) là một khuôn khổ mới cho các bài toán học tăng cường đạt được mục tiêu hướng dẫn bằng ngôn ngữ, dựa trên các hướng dẫn trong môi trường. CAREL sử dụng hàm mất mát phụ trợ lấy cảm hứng từ việc truy xuất văn bản video và theo dõi hướng dẫn, một phương pháp mới để tự động theo dõi tiến trình trong môi trường. CAREL tập trung vào việc cải thiện khả năng khái quát hóa của mô hình trên nhiều tác vụ và môi trường khác nhau, cho phép tác nhân hiểu nhiều phần của hướng dẫn trong bối cảnh môi trường để hoàn thành thành công toàn bộ tác vụ trong các tình huống đạt được mục tiêu. Kết quả thực nghiệm chứng minh hiệu quả mẫu tuyệt vời và hiệu suất khái quát hóa có hệ thống trong các bài toán học tăng cường đa phương thức.