Multi-Level Explanations for Generative Language Models
Created by
Haebom
作者
Lucas Monteiro Paes, Dennis Wei, Hyo Jin Do, Hendrik Strobelt, Ronny Luss, Amit Dhurandhar, Manish Nagireddy, Karthikeyan Natesan Ramamurthy, Prasanna Sattigeri, Werner Geyer, Soumya Ghosh
概要
本論文は、コンテキストベースのタスク(要約やクエリ応答など)に使用される大規模言語モデル(LLM)の応答生成プロセスの理解を高めるために、Multi-Level Explanations for Generative Language Models(MExGen)技術を提案します。 MExGenはコンテキストの各部分にスコアを割り当ててモデル出力への影響を定量化し、推論コストが高く、入力テキストが長く、出力がテキストであるコンテキストベースの操作に使用されるLLMに、LIMEやSHAPなどの既存の属性メソッドを拡張します。サマリーとクエリの回答を自動および手動で評価することで、既存の方法とLLMの自己説明よりも信頼性の高い説明を提供し、ICX360ツールキットの一部としてMExGenコードを公開します。