Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SenseCF: LLM-Prompted Counterfactuals for Intervention and Sensor Data Augmentation

Created by
  • Haebom

저자

Shovito Barua Soumma, Asiful Arefeen, Stephanie M. Carpenter, Melanie Hingle, Hassan Ghasemzadeh

개요

본 논문은 GPT-4o-mini와 같은 대규모 언어 모델(LLM)을 이용하여 반사실적 설명(CFs)을 생성하는 방법을 제시합니다. 제로샷 및 셋샷 학습 환경에서 AI-Readi 스트레스 예측 데이터셋과 심장 질환 검출 데이터셋을 사용하여 기존의 DiCE, CFNOW, NICE 등의 방법과 비교 평가했습니다. 그 결과, 제안된 LLM 기반 접근법은 높은 타당성(최대 99%), 강력한 유효성(최대 0.99), 그리고 경쟁력 있는 스파스성을 달성했습니다. 더 나아가, LLM로 생성된 CFs를 증강 샘플로 사용하여 downstream 분류기 성능을 향상시켰으며(평균 정확도 5% 증가), 특히 데이터가 부족한 환경에서 효과적임을 보였습니다. 이는 프롬프트 기반 생성 기법이 임상 및 생리적 예측 작업에서 설명 가능성과 강건성을 향상시킬 수 있는 잠재력을 보여줍니다.

시사점, 한계점

시사점:
LLM을 이용한 반사실적 설명 생성의 효율성 및 성능 우수성을 입증.
기존 방법 대비 높은 타당성, 유효성, 스파스성 달성.
LLM 생성 CFs를 활용한 데이터 증강을 통한 downstream 분류기 성능 향상.
임상 및 생리적 예측 작업의 설명 가능성 및 강건성 향상 가능성 제시.
한계점:
특정 LLM(GPT-4o-mini)에 대한 의존성. 다른 LLM에 대한 일반화 가능성 검증 필요.
사용된 데이터셋의 한계. 다양한 데이터셋에 대한 추가 실험 필요.
LLM 기반 접근법의 잠재적 편향성 및 신뢰성 문제에 대한 추가 연구 필요.
코드의 공개 여부가 불분명함(github 링크는 있으나 anonymous).
👍