Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Balancing Natural Language Processing Accuracy and Normalisation in Extracting Medical Insights

Created by
  • Haebom
Category
Empty

저자

Paulina Tworek, Mi{\l}osz Bargie{\l}, Yousef Khan, Tomasz Pe{\l}ech-Pilichowski, Marek Miko{\l}ajczyk, Roman Lewandowski, Jose Sousa

개요

본 연구는 비영어권 환경, 특히 자원 제약적인 환경에서의 의료 정보 추출을 위한 자연어 처리(NLP) 기술을 비교 분석합니다. 폴란드 아메리카 어린이 재활 병원의 전자 건강 기록(EHR)을 사용하여, 규칙 기반 방법과 대규모 언어 모델(LLM)의 성능을 비교 평가했습니다. 환자 인구 통계, 임상 소견, 처방 약물을 추출하며 텍스트 정규화 부족과 번역으로 인한 정보 손실의 영향을 조사했습니다. 규칙 기반 방법은 연령 및 성별 추출에서 더 높은 정확도를 보였지만, LLM은 약물명 인식에 뛰어난 성능을 보였습니다.

시사점, 한계점

규칙 기반 방법은 특정 정보 추출에서 높은 정확도를 보이지만, LLM은 유연성과 확장성 측면에서 장점을 가짐
LLM의 성능은 번역 과정에서 영향을 받을 수 있음
하이브리드 접근 방식(규칙 기반 + LLM)이 실제 병원에서 더욱 신뢰성 있고 자원 효율적인 NLP를 구현하는 데 효과적일 수 있음
연구는 폴란드 EHR 데이터에 국한되어 일반화에 한계가 있음
텍스트 정규화 및 번역의 영향에 대한 추가적인 연구가 필요함
계산 비용 및 정확성 간의 균형을 고려해야 함
👍