Sign In

Breaking Free from MMI: A New Frontier in Rationalization by Probing Input Utilization

Created by
  • Haebom
Category
Empty

저자

Wei Liu, Zhiying Deng, Zhongyu Niu, Jun Wang, Haozhao Wang, Zhigang Zeng, Ruixuan Li

개요

본 논문은 설명 가능성 연구에서 핵심적인 합리적 근거의 작은 부분집합을 추출하는 문제를 다룹니다. 기존의 최대 상호 정보량(MMI) 기준이 한계점을 가지고 있음을 보이며, MMI는 이미 일부 합리적 근거가 확인된 후에는 나머지 부분을 찾는 데 기여하는 정도가 미미하다는 점을 지적합니다. 본 논문에서는 신경망이 실제로 활용할 수 있는 입력 부분을 식별하는 대안으로, 신경망 가중치 행렬의 능력 공간과 합리적 근거 후보의 일치 정도를 비교하는 방법을 제시합니다. 이는 합리적 근거 후보의 표현 벡터 크기를 기준으로 하며, 네 가지 텍스트 분류 데이터셋과 하나의 그래프 분류 데이터셋을 사용한 실험을 통해 제안된 방법이 MMI 및 개선된 변형보다 우수한 합리적 근거를 식별함을 보여줍니다. 또한, 대표적인 LLM(llama-3.1-8b-instruct)과 비교하여 유사하거나 때로는 더 나은 결과를 얻음을 확인했습니다.

시사점, 한계점

시사점:
최대 상호 정보량(MMI) 기준의 한계를 극복하는 새로운 합리적 근거 추출 방법 제시.
신경망의 가중치 행렬 능력 공간을 활용하여 합리적 근거를 효과적으로 식별.
제안된 방법이 기존 MMI 기반 방법 및 대표적인 LLM과 비교하여 우수한 성능을 보임.
단순한 방법으로 LLM과 비교 가능한 성능을 달성하여 실용적인 활용 가능성 제시.
한계점:
제안된 방법의 일반화 성능에 대한 추가적인 연구 필요.
다양한 신경망 구조 및 데이터셋에 대한 추가적인 실험 필요.
LLM과의 비교는 특정 모델에 국한되어 더 광범위한 비교 연구 필요.
👍