Bài báo này nhấn mạnh tầm quan trọng then chốt của việc kiêng khem đáng tin cậy đối với các hệ thống tạo tìm kiếm tăng cường (RAG) trong các lĩnh vực quan trọng đối với an toàn, chẳng hạn như sức khỏe phụ nữ, nơi các câu trả lời không chính xác có thể gây hại. Chúng tôi trình bày một mô hình dựa trên năng lượng (EBM) học một bối cảnh năng lượng mượt mà cho một ngữ liệu ngữ nghĩa dày đặc gồm 2,6 triệu câu hỏi dựa trên hướng dẫn. Mô hình này cho phép hệ thống quyết định tạo ra hay kiêng khem. EBM được đánh giá dựa trên đường cơ sở softmax đã hiệu chuẩn và thuật toán tìm kiếm mật độ k-gần nhất (kNN), với trường hợp khó là các truy vấn gần các phân phối có thách thức về mặt ngữ nghĩa. EBM đạt được hiệu suất kiêng khem vượt trội trong các trường hợp có thách thức về mặt ngữ nghĩa, đạt được diện tích dưới đường cong (AUROC) là 0,961 so với 0,950 đối với đường cơ sở softmax và giảm FPR@95 từ 0,331 xuống 0,235. Mặc dù hiệu suất tương tự trong các trường hợp tiêu cực dễ dàng, nhưng lợi thế của EBM thể hiện rõ nhất trong các phân phối có thách thức, quan trọng đối với an toàn. Các nghiên cứu cắt bỏ toàn diện sử dụng phương pháp lấy mẫu âm tính có kiểm soát và phơi bày dữ liệu công bằng chứng minh rằng tính mạnh mẽ chủ yếu xuất phát từ điểm số năng lượng, và việc bao gồm hoặc loại trừ các loại âm tính cụ thể (khó, dễ hoặc hỗn hợp) làm sắc nét ranh giới quyết định nhưng không cần thiết cho việc khái quát hóa cho các trường hợp khó. Những kết quả này chứng minh rằng tự chấm điểm dựa trên năng lượng cung cấp tín hiệu tin cậy đáng tin cậy hơn so với độ tin cậy softmax dựa trên xác suất, tạo nền tảng có thể mở rộng và diễn giải cho các hệ thống RAG an toàn.