Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

A Chain-of-thought Reasoning Breast Ultrasound Dataset Covering All Histopathology Categories

Created by
  • Haebom

저자

Haojun Yu, Youcheng Li, Zihan Niu, Nan Zhang, Xuantong Gong, Huan Li, Zhiying Zou, Haifeng Qi, Zhenxiao Cao, Zijie Lan, Xingjian Yuan, Jiating He, Haokai Zhang, Shengtao Zhang, Zicheng Wang, Dong Wang, Ziwei Zhao, Congying Chen, Yong Wang, Wangyan Qin, Qingli Zhu, Liwei Wang

개요

BUS-CoT는 유방 초음파(BUS) 영상을 이용한 사고연쇄(CoT) 추론 분석을 위한 새로운 데이터셋입니다. 10,019개 병변의 11,439개 영상을 포함하며, 4,838명의 환자 데이터와 모든 99가지 조직병리학적 유형을 다룹니다. 경험이 풍부한 전문가가 관찰, 특징, 진단 및 병리학적 라벨을 주석하고 검증하여 CoT 추론을 유도하는 추론 과정을 구성했습니다. 모든 조직병리학적 유형의 병변을 포함하여 임상 실무에서 오류가 발생하기 쉬운 드문 경우에도 견고한 AI 시스템을 개발하는 데 목표를 두고 있습니다.

시사점, 한계점

시사점:
대규모, 다양한 유방 초음파 데이터셋 제공으로 AI 개발을 위한 벤치마크 확보.
모든 조직병리학적 유형 포함으로 희귀 질환 진단 AI 개발 가능성 제시.
사고연쇄(CoT) 추론 분석을 위한 주석 데이터 제공으로 AI 모델의 설명력 향상에 기여.
실제 임상 환경에서 발생 가능한 다양한 유형의 병변을 포함하여 더욱 강건한 AI 모델 개발 가능.
한계점:
데이터셋의 규모가 다른 대규모 의료영상 데이터셋에 비해 상대적으로 작을 수 있음.
전문가에 의한 주석 및 검증 과정의 주관성이 결과에 영향을 미칠 수 있음.
데이터셋의 일반화 성능에 대한 추가적인 검증이 필요함.
👍