Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools

Created by
  • Haebom

저자

Lena Schmidt, Oshin Sharma, Chris Marshall, Sonia Garcia Gonzalez Moral

개요

본 논문은 의료 분야의 호라이즌 스캐닝(horizon scanning) 효율을 높이기 위한 두 가지 오픈소스 파이썬 기반 도구, SCANAR과 AIDOC를 소개한다. SCANAR은 뉴스 기사와 같은 비정형 데이터 소스에서 정보를 자동으로 수집하고 처리하며, 중복 제거 및 비지도 학습 기반의 관련성 순위 매김 기능을 제공한다. AIDOC는 인공지능을 활용하여 텍스트 데이터의 관련성에 따라 재정렬하고, 신경망을 이용하여 의미적 유사성을 분석하여 사람의 검토가 필요한 항목을 우선순위로 정렬한다. 12개의 내부 데이터셋과 4개의 외부 벤치마킹 데이터셋을 사용한 실험 결과, SCANAR은 기존의 수작업에 의존하던 정보 검색 과정의 효율성을 높였으며, AIDOC는 95%의 재현율(recall)에서 수동 검토 작업량을 약 62% 줄이는 효과를 보였다. AIDOC의 성능은 기존의 체계적 문헌 검토 자동화 도구와 유사했지만, 데이터셋의 특성에 따라 성능 차이가 있었다. 또한 뉴스 데이터셋을 이용한 소규모 사례 연구는, 능동 학습 과정에서 대규모 언어 모델을 활용하면 뉴스 데이터셋에서 관련 기사를 더 빠르게 탐색할 수 있음을 보여준다. 결론적으로 SCANAR과 AIDOC는 데이터 검색 및 우선순위 지정을 간소화하여 호라이즌 스캐닝의 효율성을 높일 가능성을 보여준다.

시사점, 한계점

시사점:
SCANAR과 AIDOC는 의료 호라이즌 스캐닝의 효율성을 향상시킬 수 있는 잠재력을 보여준다.
자동화된 데이터 처리를 통해 수작업 시간을 절감하고, 더 광범위하고 신속한 호라이즌 스캐닝을 가능하게 한다.
대규모 언어 모델을 활용한 능동 학습의 효용성을 제시한다.
한계점:
AIDOC의 성능은 데이터셋의 특성에 따라 다르게 나타났다. 더욱 광범위한 데이터셋에 대한 검증이 필요하다.
대규모 언어 모델 통합을 위한 최적화 및 새로운 워크플로우와 검증 프로세스 개발이 필요하다.
현재는 오픈소스 파이썬 기반이므로, 다른 환경에서의 적용 가능성 및 호환성에 대한 추가 연구가 필요하다.
👍