Trong bài báo này, chúng tôi đề xuất một phương pháp tinh chỉnh mô hình khuếch tán tiềm ẩn (LDM) dựa trên học tăng cường cho siêu phân giải ảnh viễn thám. Để khắc phục những hạn chế của các phương pháp học sâu hiện có trong xử lý cảnh phức tạp và bảo toàn chi tiết ảnh, chúng tôi xây dựng một môi trường học tăng cường giúp tối ưu hóa mục tiêu quyết định trong quá trình khử nhiễu ngược của mô hình LDM bằng phương pháp tối ưu hóa chính sách gần (PPO). Kết quả thực nghiệm trên tập dữ liệu RESISC45 cho thấy hiệu suất được cải thiện từ 3 đến 4 dB ở PSNR, 0,08 đến 0,11 ở SSIM và 0,06 đến 0,10 ở LPIPS so với mô hình cơ sở, cho thấy phương pháp này đặc biệt hiệu quả trong các cảnh thiên nhiên có cấu trúc và phức tạp.