Sign In

Foundation Models -- A Panacea for Artificial Intelligence in Pathology?

Created by
  • Haebom
Category
Empty

저자

Nita Mulliqi (Department of Medical Epidemiology and Biostatistics, Karolinska Institutet, Stockholm, Sweden), Anders Blilie (Department of Pathology, Stavanger University Hospital, Stavanger, Norway, Faculty of Health Sciences, University of Stavanger, Stavanger, Norway), Xiaoyi Ji (Department of Medical Epidemiology and Biostatistics, Karolinska Institutet, Stockholm, Sweden), Kelvin Szolnoky (Department of Medical Epidemiology and Biostatistics, Karolinska Institutet, Stockholm, Sweden), Henrik Olsson (Department of Medical Epidemiology and Biostatistics, Karolinska Institutet, Stockholm, Sweden), Sol Erika Boman (Department of Medical Epidemiology and Biostatistics, Karolinska Institutet, Stockholm, Sweden, Department of Molecular Medicine and Surgery, Karolinska Institutet, Stockholm, Sweden), Matteo Titus (Department of Medical Epidemiology and Biostatistics, Karolinska Institutet, Stockholm, Sweden), Geraldine Martinez Gonzalez (Department of Medical Epidemiology and Biostatistics, Karolinska Institutet, Stockholm, Sweden), Julia Anna Mielcarz (Department of Medical Epidemiology and Biostatistics, Karolinska Institutet, Stockholm, Sweden), Masi Valkonen (Institute of Biomedicine, University of Turku, Turku, Finland), Einar Gudlaugsson (Department of Pathology, Stavanger University Hospital, Stavanger, Norway), Svein R. Kjosavik (The General Practice and Care Coordination Research Group, Stavanger University Hospital, Norway, Department of Global Public Health and Primary Care, Faculty of Medicine, University of Bergen, Norway), Jose Asenjo (Department of Pathology, Synlab, Madrid, Spain), Marcello Gambacorta (Department of Pathology, Synlab, Brescia, Italy), Paolo Libretti (Department of Pathology, Synlab, Brescia, Italy), Marcin Braun (Department of Pathology, Chair of Oncology, Medical University of Lodz, Lodz, Poland), Radzislaw Kordek (Department of Pathology, Chair of Oncology, Medical University of Lodz, Lodz, Poland), Roman {\L}owicki (1st Department of Urology, Medical University of Lodz, Lodz, Poland), Kristina Hotakainen (Department of Clinical Chemistry and Hematology, University of Helsinki, Helsinki, Finland, Laboratory Services, Mehilainen Oy, Helsinki, Finland), Paivi Vare (Department of Pathology, Mehilainen Lansi-Pohja Hospital, Kemi, Finland), Bodil Ginnerup Pedersen (Department of Radiology, Aarhus University Hospital, Aarhus, Denmark, Department of Clinical Medicine, Aarhus University, Aarhus, Denmark), Karina Dalsgaard S{\o}rensen (Department of Clinical Medicine, Aarhus University, Aarhus, Denmark, Department of Molecular Medicine, Aarhus University Hospital, Aarhus, Denmark), Benedicte Parm Ulh{\o}i (Department of Pathology, Aarhus University Hospital, Aarhus, Denmark), Pekka Ruusuvuori (Institute of Biomedicine, University of Turku, Turku, Finland, InFLAMES Research Flagship, University of Turku, Turku, Finland, Faculty of Medicine and Health Technology, Tampere University, Tampere, Finland), Brett Delahunt (Malaghan Institute of Medical Research, Wellington, New Zealand, Department of Oncology and Pathology, Karolinska Institutet, Stockholm, Sweden), Hemamali Samaratunga (Aquesta Uropathology and University of Queensland, QLD, Brisbane, Australia), Toyonori Tsuzuki (Department of Surgical Pathology, School of Medicine, Aichi Medical University, Nagoya, Japan), Emilius A. M. Janssen (Department of Pathology, Stavanger University Hospital, Stavanger, Norway, Department of Chemistry, Bioscience and Environmental Engineering, University of Stavanger, Stavanger, Norway, Institute for Biomedicine and Glycomics, Griffith University, Queensland, Australia), Lars Egevad (Department of Oncology and Pathology, Karolinska Institutet, Stockholm, Sweden), Martin Eklund (Department of Medical Epidemiology and Biostatistics, Karolinska Institutet, Stockholm, Sweden), Kimmo Kartasalo (Department of Medical Epidemiology and Biostatistics, SciLifeLab, Karolinska Institutet, Stockholm, Sweden)

개요

본 논문은 전립선암 진단 및 글리슨 등급 분류를 위한 임상 수준의 AI 성능에 초점을 맞춰, 11개국 15개 사이트의 7,342명 환자의 10만 개 이상의 코어 바늘 생검을 사용하여 AI의 가장 큰 검증 연구를 제시합니다. 두 가지 기반 모델(FM)과 완전한 엔드투엔드 작업별(TS) 모델을 다중 인스턴스 학습 프레임워크에서 비교하여, 데이터가 부족한 경우 FM이 유용하지만 충분한 레이블이 지정된 훈련 데이터가 있을 때 TS 모델과 성능이 유사해지거나 심지어 TS 모델에 뒤처지는 경우가 있다는 것을 발견했습니다. 특히, 광범위한 작업별 훈련은 임상적으로 중요한 등급 오류, 어려운 형태의 오진 및 다양한 WSI 스캐너 간의 변동성을 크게 줄였습니다. 또한 FM은 TS 모델보다 최대 35배 많은 에너지를 소비하여 지속 가능성에 대한 우려를 제기했습니다. 결론적으로, FM은 빠른 프로토타이핑과 연구에 명확한 이점을 제공하지만, 임상적으로 적용 가능한 의료 AI에 대한 범용 솔루션으로서의 역할은 불확실하며, 고위험 임상 적용의 경우 엄격한 검증과 작업별 훈련에 대한 고려가 중요하다고 주장합니다.

시사점, 한계점

시사점:
데이터가 부족한 상황에서 기반 모델(FM)이 유용함을 확인.
충분한 데이터가 존재할 경우 작업 특화 모델(TS)의 성능이 기반 모델과 비슷하거나 더 우수할 수 있음을 보임.
작업 특화 훈련은 임상적으로 중요한 오류를 감소시키고, 다양한 스캐너 간의 변동성을 줄임.
기반 모델과 엔드투엔드 학습의 강점을 통합하여 강력하고 자원 효율적인 AI 병리학 솔루션을 개발해야 함을 제시.
한계점:
기반 모델이 작업 특화 모델보다 에너지 소비가 최대 35배 더 높음. 지속 가능성에 대한 우려 제기.
기반 모델이 임상적으로 적용 가능한 의료 AI에 대한 범용 솔루션으로서의 역할이 불확실함.
고위험 임상 적용을 위해서는 엄격한 검증과 작업 특화 훈련이 중요함을 강조.
👍