Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Can LLMs Help Allocate Public Health Resources? A Case Study on Childhood Lead Testing

Created by
  • Haebom
Category
Empty

저자

Mohamed Afane, Ying Wang, Juntao Chen

개요

본 논문은 공공 보건 기관이 아동 납 노출 고위험 지역을 식별하고 제한된 자원으로 자원 배분을 최적화하는 데 어려움을 겪는 문제를 해결하고자 한다. 시카고, 뉴욕, 워싱턴 D.C.의 136개 지역 사회를 대상으로 미검사 아동 비율, 혈중 납 농도 증가율, 공공 보건 서비스 범위를 통합한 우선 순위 점수를 개발했다. 또한, 에이전트 추론 및 심층 연구 능력을 갖춘 대규모 언어 모델(LLM)이 구조화된 자원 배분 시나리오에서 공공 보건 자원을 효과적으로 배분할 수 있는지 평가했다. LLM은 각 도시에서 1,000개의 검사 키트를 지역 사회의 취약성 지표를 기반으로 배분하도록 요청받았다.

시사점, 한계점

LLM은 높은 납 유병률과 미검사 아동 비율이 높은 지역 사회(예: 시카고의 West Englewood)를 자주 간과하고, 우선순위가 낮은 지역 사회(예: 뉴욕의 Hunts Point)에 과도한 자원을 할당했다.
전반적인 정확도는 평균 0.46이었으며, ChatGPT 5 Deep Research의 경우 최대 0.66에 도달했다.
LLM은 정보 검색 및 증거 기반 추론에 근본적인 한계가 있었으며, 오래된 데이터를 인용하고 정량적 취약성 지표보다 지역 사회 상황에 대한 비경험적 설명을 우선시하는 경향을 보였다.
👍