Bài báo này khám phá việc sử dụng các mô hình ngôn ngữ quy mô lớn (LLM) trong hệ thống trả lời câu hỏi trực quan dựa trên tri thức (VQA). Khác với các nghiên cứu trước đây trực tiếp khiến LLM dự đoán câu trả lời, bài báo này đề xuất một khuôn khổ mới, PLRH, tận dụng phương pháp suy luận hợp lý (rational heuristics), một quá trình suy luận trung gian. PLRH sử dụng Chuỗi Tư duy (CoT) để hướng dẫn LLM tạo ra các phương pháp suy luận hợp lý, sau đó được sử dụng để dự đoán câu trả lời. Kết quả thực nghiệm cho thấy PLRH vượt trội hơn các mô hình cơ sở hiện có lần lượt 2,2 và 2,1 điểm trong bài kiểm tra OK-VQA và A-OKVQA.