Counterfactual Simulatability of LLM Explanations for Generation Tasks
Created by
Haebom
Category
Empty
저자
Marvin Limpijankit, Yanda Chen, Melanie Subbiah, Nicholas Deas, Kathleen McKeown
개요
LLM은 프롬프트의 미세한 변경에도 예측 불가능한 출력을 생성할 수 있다. 특히 중요한 상황에서 모델의 행동을 정확하게 설명하는 능력은 매우 중요하다. 이 연구는 LLM의 설명을 평가하는 방법 중 하나인 반사실 시뮬레이션 가능성을 제시하고, 뉴스 요약 및 의료 제안과 같은 생성 작업에 적용할 수 있는 일반적인 프레임워크를 제공한다. 뉴스 요약에서는 LLM 설명이 사용자가 반사실에 대한 LLM 출력을 더 잘 예측할 수 있게 하지만, 의료 제안에서는 개선의 여지가 크다는 것을 발견했다.