Hallucination Detection-Guided Preference Optimization for Clinical Summarization

작성자

Haebom

카테고리

Empty

저자

Shamanth Kuthpadi Seethakantha, Dung Ngoc Thai, Vara Prasad Gudi, Simran Tiwari, Rami Matar, Avijit Mitra, Wenlong Zhao, Andrew McCallum, Wael Salloum

💡 개요

본 연구는 임상 요약에서 LLM의 환각(hallucination) 문제를 해결하기 위해 환각 탐지기를 활용한 새로운 방법론을 제안합니다. 제안된 두 가지 방법론인 "Hallucination Detection-Guided Preference Optimization" (itermodel)과 "Hallucination Detection-Guided Preference Optimization for Preference Learning" (model)은 요약의 사실성을 개선하고 환각을 효과적으로 줄입니다. 실험 결과, Llama 및 Gemma 모델에서 환각이 크게 감소했으며, 요약의 유창성, 일관성 및 관련성도 유지됨을 입증했습니다.

🔑 시사점 및 한계

•

환각 탐지기를 활용한 반복적인 요약 개선이 임상 요약의 사실성을 높이는 효과적인 전략임을 보여줍니다.

•

탐지기 기반 개선 경로를 선호도 쌍으로 변환하여 모델 미세 조정하는 방식이 환각 감소에 효과적임을 입증합니다.

•

제시된 방법론은 Llama 및 Gemma와 같은 최신 LLM에서 환각을 유의미하게 줄이며, 임상 정보의 정확성을 높이는 데 기여할 수 있습니다.

•

환각 탐지기의 성능 자체 또는 탐지기와 생성 모델 간의 상호 작용에 대한 추가적인 연구가 필요합니다.

PDF 보기

Made with Slashpage