Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Spurious Correlations and Beyond: Understanding and Mitigating Shortcut Learning in SDOH Extraction with Large Language Models

Created by
  • Haebom

저자

Fardin Ahsan Sakib, Ziwei Zhu, Karen Trister Grace, Meliha Yetisgen, Ozlem Uzuner

개요

본 논문은 의료 텍스트에서 사회적 건강 결정 요인(SDOH)을 추출하는 과정에서 대규모 언어 모델(LLM)이 표면적인 단서에 의존하여 잘못된 예측을 내릴 수 있음을 보여줍니다. SHAC 데이터셋의 MIMIC 부분을 사용하여 약물 사용 여부 추출을 사례 연구로 삼아, 알코올 또는 흡연 언급이 실제 약물 사용이 없는 경우에도 모델이 잘못된 예측을 하도록 유도할 수 있음을 밝혔습니다. 또한, 모델 성능에서 우려되는 성별 불균형을 발견하였습니다. 프롬프트 엔지니어링 및 사고 연쇄 추론과 같은 완화 전략을 평가하여 이러한 오류를 줄이는 방법을 제시하고, 의료 분야에서 LLM의 신뢰성을 높이는 데 대한 통찰력을 제공합니다.

시사점, 한계점

시사점:
LLM을 이용한 의료 텍스트 분석에서 사회적 건강 결정 요인 추출 시 표면적 단서에 대한 과도한 의존으로 인한 오류 가능성을 제시.
알코올, 흡연 언급과 약물 사용 예측 간의 잘못된 연관성을 밝힘.
모델 성능의 성별 불균형 문제를 확인.
프롬프트 엔지니어링 및 사고 연쇄 추론 등의 완화 전략을 통해 LLM의 신뢰성 향상 가능성을 제시.
한계점:
MIMIC 데이터셋의 일부분만 사용하여 연구를 진행하였으므로 일반화 가능성에 대한 제한.
약물 사용 추출에만 집중하여 다른 SDOH 추출에 대한 일반화에는 한계.
제시된 완화 전략의 효과가 모든 상황에 적용될 수 있는지 추가 연구 필요.
👍