Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Comparative Evaluation of Generative AI Models for Chest Radiograph Report Generation in the Emergency Department

Created by
  • Haebom
Category
Empty

저자

Woo Hyeon Lim, Ji Young Lee, Jong Hyuk Lee, Saehoon Kim, Hyungjin Kim

개요

응급실을 방문한 발열 또는 호흡기 증상 성인 환자를 대상으로, 5개의 VLM(AIRead, Lingshu, MAIRA-2, MedGemma, MedVersa)의 CXR 보고서 생성 능력을 방사선 전문의의 보고서와 비교 평가했습니다. AIRead는 RADPEER, 임상적 수용성, 환각, 언어 명확성에서 다른 VLM보다 우수한 성능을 보였습니다.

시사점, 한계점

AIRead는 보고서 품질과 진단 측정에서 다른 VLM보다 우수한 성능을 보였습니다.
다른 VLM들은 보고서 품질, 임상적 수용성, 환각 발생, 민감도 등에서 다양한 성능을 보였습니다.
본 연구는 특정 VLM의 성능을 제한된 환자 표본과 기준을 사용하여 평가했습니다.
각 VLM의 민감도 차이가 컸습니다.
👍