Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Multi-Level Explanations for Generative Language Models

Created by
  • Haebom

作者

Lucas Monteiro Paes, Dennis Wei, Hyo Jin Do, Hendrik Strobelt, Ronny Luss, Amit Dhurandhar, Manish Nagireddy, Karthikeyan Natesan Ramamurthy, Prasanna Sattigeri, Werner Geyer, Soumya Ghosh

概要

本論文は、コンテキストベースのタスク(要約やクエリ応答など)に使用される大規模言語モデル(LLM)の応答生成プロセスの理解を高めるために、Multi-Level Explanations for Generative Language Models(MExGen)技術を提案します。 MExGenはコンテキストの各部分にスコアを割り当ててモデル出力への影響を定量化し、推論コストが高く、入力テキストが長く、出力がテキストであるコンテキストベースの操作に使用されるLLMに、LIMEやSHAPなどの既存の属性メソッドを拡張します。サマリーとクエリの回答を自動および手動で評価することで、既存の方法とLLMの自己説明よりも信頼性の高い説明を提供し、ICX360ツールキットの一部としてMExGenコードを公開します。

Takeaways、Limitations

Takeaways:
LLMの応答生成プロセスの理解度を向上
コンテキストベースの作業におけるLLMの記述可能性の向上
既存の属性メソッドの限界を克服し改善された説明を提供する
オープンソース公開による研究と活用の容易さの向上
Limitations:
具体的なLimitationsの議論の欠如(論文に明示的に記載されていない)
提案された方法の一般化の可能性に関するさらなる研究が必要
さまざまなLLMとタスクの追加実験が必要
👍