본 논문은 여성 건강과 같이 잘못된 답변이 해를 끼칠 수 있는 안전에 중요한 영역에서 신뢰할 수 있는 자제(abstention)가 검색 증강 생성(RAG) 시스템에 매우 중요하다는 점을 강조합니다. 260만 개의 가이드라인 기반 질문으로 구성된 밀집된 의미적 코퍼스에 대한 매끄러운 에너지 지형을 학습하는 에너지 기반 모델(EBM)을 제시합니다. 이 모델은 시스템이 생성할지 또는 자제할지 결정할 수 있게 합니다. EBM은 보정된 소프트맥스 기준 및 k-최근접 이웃(kNN) 밀도 휴리스틱과 비교 평가되었으며, 어려운 경우는 의미적으로 도전적인 분포 근처 쿼리입니다. EBM은 의미적으로 어려운 경우에 우수한 자제 성능을 달성하며, 소프트맥스의 0.950에 비해 AUROC 0.961을 달성하고 FPR@95도 0.331에서 0.235로 감소시킵니다. 쉬운 부정적인 경우에는 성능이 비슷하지만, EBM의 장점은 안전에 중요한 어려운 분포에서 가장 두드러집니다. 제어된 부정적 샘플링 및 공정한 데이터 노출을 통한 포괄적인 ablation 연구는 강건성이 주로 에너지 점수 헤드에서 비롯되며, 특정 부정적 유형(어려운, 쉬운, 혼합)의 포함 또는 제외는 결정 경계를 선명하게 하지만 어려운 경우에 대한 일반화에는 필수적이지 않음을 보여줍니다. 이러한 결과는 에너지 기반 자제 점수 매기기가 확률 기반 소프트맥스 신뢰도보다 더 신뢰할 수 있는 신뢰 신호를 제공하며, 안전한 RAG 시스템을 위한 확장 가능하고 해석 가능한 기반을 제공함을 보여줍니다.