본 논문은 대규모 언어 모델(LLM)의 환각(hallucination) 문제 해결을 위한 새로운 방법인 Truthfulness Separator Vector (TSV)를 제안합니다. TSV는 모델 파라미터를 변경하지 않고 추론 과정에서 LLM의 표현 공간을 재구성하여 사실적 내용과 환각적 내용을 더 명확하게 분리하는 경량의 조향 벡터입니다. 두 단계 프레임워크를 통해 소량의 라벨된 데이터로 TSV를 학습하고, 최적 전송(optimal transport) 기반 알고리즘과 신뢰도 기반 필터링을 사용하여 라벨되지 않은 LLM 생성 결과를 활용합니다. 실험 결과, TSV는 최소한의 라벨 데이터로 최첨단 성능을 달성하고 데이터 집합 간에 강력한 일반화 성능을 보이는 실용적인 솔루션임을 보여줍니다.