Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Enhancing Interpretability in Generative AI Through Search-Based Data Influence Analysis

Created by
  • Haebom

저자

Theodoros Aivalis, Iraklis A. Klampanos, Antonis Troumpoukis, Joemon M. Jose

개요

본 논문은 생성형 AI 모델의 결과물 해석 어려움 문제를 해결하기 위해, 훈련 데이터의 영향 분석을 통해 모델의 해석력을 향상시키는 검색 기반 접근 방식을 제시한다. 모델의 내부 상태가 아닌 출력물에 초점을 맞춘 관찰적 해석 가능성에 중점을 두며, 원시 데이터와 잠재 공간 임베딩 모두를 고려하여 생성된 콘텐츠에서 데이터 항목의 영향을 검색한다. 모델의 재훈련 및 영향력 있는 훈련 데이터 하위 집합 발견을 통해 제안된 방법의 효과를 평가하고, 향후 도메인 전문가의 사용자 기반 평가를 통한 관찰적 해석 가능성 향상을 위한 확장 가능성을 제시한다.

시사점, 한계점

시사점:
생성형 AI 모델의 해석력 향상을 위한 새로운 접근 방식 제시.
훈련 데이터의 영향 분석을 통해 모델의 투명성 증대.
원시 데이터와 잠재 공간 임베딩 모두 고려하여 분석 정확도 향상.
향후 도메인 전문가의 평가를 통한 추가적인 해석력 향상 가능성 제시.
한계점:
현재는 모델 재훈련 및 하위 집합 발견을 통한 평가에 국한, 사용자 기반 평가는 미완료.
도메인 전문가의 주관적 평가에 대한 의존성 존재.
다양한 생성형 AI 모델 및 데이터셋에 대한 일반화 가능성 검증 필요.
👍