Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ReXGroundingCT: A 3D Chest CT Dataset for Segmentation of Findings from Free-Text Reports

Created by
  • Haebom

저자

Mohammed Baharoon, Luyang Luo, Michael Moritz, Abhinav Kumar, Sung Eun Kim, Xiaoman Zhang, Miao Zhu, Mahmoud Hussain Alabbad, Maha Sbayel Alhazmi, Neel P. Mistry, Kent Ryan Kleinschmidt, Brady Chrisler, Sathvik Suryadevara, Sri Sai Dinesh Jaliparthi, Noah Michael Prudlo, Mark David Marino, Jeremy Palacio, Rithvik Akula, Hong-Yu Zhou, Ibrahim Ethem Hamamci, Scott J. Adams, Hassan Rayhan AlOmaish, Pranav Rajpurkar

개요

ReXGroundingCT는 자유 텍스트 방사선학 소견과 3D 흉부 CT 스캔의 픽셀 수준 분할을 수동으로 주석 처리하여 연결하는 최초의 공개 데이터셋입니다. 기존 데이터셋이 구조화된 레이블이나 미리 정의된 범주에 의존한 반면, ReXGroundingCT는 자유 텍스트로 표현된 임상 언어의 모든 표현력을 포착하고 부피 영상의 공간적으로 국한된 3D 분할 주석에 근거합니다. 이는 복잡하고 설명적인 텍스트(예: "왼쪽 아래 엽에 3mm 결절")를 3차원 공간에서 정확한 해부학적 위치에 연결하는 능력, 즉 근거 기반 방사선 보고서 생성 시스템에 필수적인 기능이라는 의료 AI의 중요한 간극을 해결합니다. 데이터셋은 CT-RATE 데이터셋의 표준화된 방사선 보고서와 쌍을 이루는 3,142개의 비조영증강 흉부 CT 스캔으로 구성됩니다. 체계적인 3단계 파이프라인을 사용하여 GPT-4는 양성 폐 및 흉막 소견을 추출했으며, 이는 전문 주석가에 의해 수동으로 분할되었습니다. 전체 16,301개의 개체에 걸쳐 총 8,028개의 소견이 주석 처리되었으며, 인증받은 방사선 전문의가 품질 관리를 수행했습니다. 소견의 약 79%가 국소 이상이며, 21%는 국소가 아닙니다. 학습 세트에는 소견당 최대 세 개의 대표 분할이 포함되어 있으며, 검증 및 테스트 세트에는 각 소견 개체에 대한 완전한 레이블이 포함되어 있습니다. ReXGroundingCT는 흉부 CT에서 문장 수준 근거 및 자유 텍스트 의료 분할 모델을 개발하고 평가하기 위한 새로운 벤치마크를 설정합니다. 데이터셋은 https://huggingface.co/datasets/rajpurkarlab/ReXGroundingCT에서 이용할 수 있습니다.

시사점, 한계점

시사점:
자유 텍스트 방사선학 소견과 3D 흉부 CT 스캔의 픽셀 수준 분할을 연결하는 최초의 공개 데이터셋 제공.
의료 AI에서 복잡한 자유 텍스트를 3차원 공간 내 정확한 해부학적 위치에 연결하는 기능을 제공하여 근거 기반 방사선 보고서 생성 시스템 개발에 기여.
흉부 CT에서 문장 수준 근거 및 자유 텍스트 의료 분할 모델 개발 및 평가를 위한 새로운 벤치마크 설정.
한계점:
데이터셋의 크기 및 다양성에 대한 추가적인 연구가 필요할 수 있음. (명시적으로 언급된 것은 아니지만 데이터셋의 규모에 대한 한계는 항상 고려되어야 함)
GPT-4를 이용한 소견 추출 과정의 정확도 및 잠재적 편향에 대한 추가 검증 필요.
수동 주석 처리 과정의 주관성 및 오류 가능성 고려 필요.
👍