본 논문은 텍스트 생성 모델의 신뢰도 점수를 개선하는 새로운 방법을 제안합니다. 기존의 신뢰도 측정 방법은 텍스트 생성에서 여러 개의 타당한 결과가 존재할 수 있다는 점을 고려하지 못하는 한계가 있습니다. 따라서, 본 논문에서는 모델 출력과 관련된 확률에만 의존하여 추가적인 미세 조정이나 휴리스틱 없이도 생성에 적합한 과제 비의존적 신뢰도 측정 방법을 제안합니다. 제안된 방법을 사용하여 요약, 번역 및 질문응답 데이터셋에서 BART와 Flan-T5 모델의 신뢰도 보정을 향상시켰습니다. 잘 보정된 신뢰도 점수는 낮은 신뢰도를 가진 예측을 사용자가 검토하도록 유도하여 잘못되거나 위험한 예측을 방지하는 데 도움이 됩니다.