APCD: Adaptive Path-Contrastive Decoding for Reliable Large Language Model Generation

작성자

Haebom

카테고리

Empty

저자

Tianyu Zheng, Hong Wu, Jiaji Zhong

💡 개요

본 논문은 대규모 언어 모델(LLM)의 환각 현상(hallucination) 문제를 해결하기 위해 적응형 경로-대조 디코딩(APCD)이라는 새로운 다중 경로 디코딩 프레임워크를 제안합니다. APCD는 예측 불확실성이 높을 때만 분기하여 경로 탐색을 지연시키고, 경로 간의 상호작용을 동적으로 조절하여 생성의 신뢰성을 높입니다. 여러 벤치마크에서의 실험 결과, 기존 방법 대비 사실적 정확도를 향상시키면서도 디코딩 효율성을 유지하는 성과를 보였습니다.

🔑 시사점 및 한계

•

LLM의 환각 현상을 완화하고 생성 신뢰성을 높이기 위한 효과적인 다중 경로 디코딩 전략을 제시합니다.

•

예측 불확실성을 기반으로 하는 동적 경로 확장 및 경로 간 상호작용 조절을 통해 성능을 향상시킵니다.

•

다양한 벤치마크에서 실험적으로 검증된 우수한 성능과 효율성을 입증했습니다.

•

특정 모델 아키텍처나 데이터셋에 대한 추가적인 검증이 필요할 수 있으며, APCD의 계산 복잡성에 대한 더 깊은 분석이 필요할 수 있습니다.

PDF 보기

Made with Slashpage