Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Automated Risk-of-Bias Assessment of Randomized Controlled Trials: A First Look at a GEPA-trained Programmatic Prompting Framework

Created by
  • Haebom
Category
Empty

저자

Lingbo Li, Anuradha Mathrani, Teo Susnjak

개요

본 연구는 무작위 대조 임상 시험(RCT)에서 편향 위험(RoB) 평가를 자동화하기 위해 대규모 언어 모델(LLM)을 활용하는 방법을 제시합니다. 기존의 수동적 프롬프트 설계의 한계를 극복하기 위해, DSPy와 GEPA 모듈을 사용하여 코드 기반의 구조화된 최적화를 통해 LLM 추론을 개선하는 프로그래밍 가능한 RoB 평가 파이프라인을 도입했습니다. 이 방법은 투명한 복제를 가능하게 하는 검토 가능한 실행 추적을 생성하며, 7개의 RoB 도메인에 걸쳐 공개 가중치 모델과 상업적 모델을 사용하여 100개의 RCT에서 평가되었습니다.

시사점, 한계점

GEPA는 RoB 평가를 위한 일관되고 재현 가능한 프롬프트를 생성할 수 있으며, 증거 합성에 LLM의 구조화되고 원칙적인 사용을 지원합니다.
명확한 방법론적 보고가 있는 도메인(예: 무작위 순서 생성)에서 GEPA 생성 프롬프트가 가장 뛰어난 성능을 보였습니다.
상업적 모델이 전반적으로 약간 더 나은 성능을 보였습니다.
GEPA는 수동으로 설계된 프롬프트와 비교하여 경쟁력 있는 성능을 달성했습니다.
GEPA는 무작위 순서 생성 및 선택적 보고에서 30%-40% 성능 향상을 보였습니다.
👍