Comparative Evaluation of Generative AI Models for Chest Radiograph Report Generation in the Emergency Department
Created by
Haebom
Category
Empty
저자
Woo Hyeon Lim, Ji Young Lee, Jong Hyuk Lee, Saehoon Kim, Hyungjin Kim
개요
응급실을 방문한 발열 또는 호흡기 증상 성인 환자를 대상으로, 5개의 VLM(AIRead, Lingshu, MAIRA-2, MedGemma, MedVersa)의 CXR 보고서 생성 능력을 방사선 전문의의 보고서와 비교 평가했습니다. AIRead는 RADPEER, 임상적 수용성, 환각, 언어 명확성에서 다른 VLM보다 우수한 성능을 보였습니다.
시사점, 한계점
•
AIRead는 보고서 품질과 진단 측정에서 다른 VLM보다 우수한 성능을 보였습니다.
•
다른 VLM들은 보고서 품질, 임상적 수용성, 환각 발생, 민감도 등에서 다양한 성능을 보였습니다.