Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CNS-Obsidian: A Neurosurgical Vision-Language Model Built From Scientific Publications

Created by
  • Haebom
Category
Empty

저자

Anton Alyakin, Jaden Stryker, Daniel Alexander Alber, Jin Vivian Lee, Karl L. Sangwon, Brandon Duderstadt, Akshay Save, David Kurland, Spencer Frome, Shrutika Singh, Jeff Zhang, Eunice Yang, Ki Yun Park, Cordelia Orillac, Aly A. Valliani, Sean Neifert, Albert Liu, Aneek Patel, Christopher Livia, Darryl Lau, Ilya Laufer, Peter A. Rozman, Eveline Teresa Hidalgo, Howard Riina, Rui Feng, Todd Hollon, Yindalon Aphinyanaphongs, John G. Golfinos, Laura Snyder, Eric Leuthardt, Douglas Kondziolka, Eric Karl Oermann

개요

CNS-Obsidian은 신경외과 분야에 특화된 VLM으로, 무작위 인터넷 데이터를 기반으로 학습된 일반 목적 VLM의 한계를 극복하기 위해 동료 심사를 거친 문헌을 사용하여 훈련되었습니다. 23,984개의 신경외과 관련 논문을 바탕으로 78,853개의 그림과 캡션을 수집하고, GPT-4o 및 Claude Sonnet-3.5를 사용하여 263,064개의 훈련 샘플을 생성했습니다. 340억 개의 파라미터를 가진 LLaVA-Next 모델을 미세 조정하여 CNS-Obsidian을 개발했습니다. NYU Langone Health에서 진행된 무작위 임상 시험 결과, CNS-Obsidian은 합성 질문에서 GPT-4o와 유사한 성능을 보였지만, 사람의 질문에 대해서는 더 낮은 정확도를 보였습니다. 임상 시험에서 CNS-Obsidian은 GPT-4o에 비해 낮은 긍정적 평가를 받았지만, 두 모델 모두 약 60%의 경우에서 정확한 진단을 포함했습니다. CNS-Obsidian은 특정 도메인의 큐레이션된 과학 문헌을 기반으로 훈련된 VLM이 더 작고 저렴하면서도 최첨단 모델에 근접하는 성능을 낼 수 있음을 보여주었습니다.

시사점, 한계점

시사점:
큐레이션된 과학 문헌 기반의 도메인 특화 VLM은 일반 목적 VLM과 유사한 성능을 달성할 수 있습니다.
CNS-Obsidian은 신경외과 분야에서 GPT-4o와 비교하여 임상적 유용성을 보였습니다.
투명한 학습 데이터를 활용하여 전문 분야에 특화된 AI 모델을 구축할 수 있는 프레임워크를 제시했습니다.
한계점:
사람이 생성한 질문에서 GPT-4o보다 낮은 정확도를 보였습니다.
임상 시험에서 GPT-4o에 비해 긍정적 평가를 덜 받았습니다.
임상 시험의 표본 크기가 제한적이었습니다 (70건의 컨설테이션).
모델의 실제 활용률이 낮았습니다 (전체 컨설테이션의 7.3%).
👍