Comparing Lexical and Semantic Vector Search Methods When Classifying Medical Documents
Created by
Haebom
저자
Lee Harris, Philippe De Wilde, James Bentham
개요
본 논문은 의료 문서 분류 작업에서 기존의 어휘 기반 벡터 검색 방식이 최신 신경망 기반 의미 벡터 검색 방식보다 예측 정확도가 약간 높고, 실행 시간도 훨씬 짧다는 것을 보여줍니다. 이는 신경망 모델이 항상 최선의 해결책이 아니며, 전통적인 방법 또한 정보 검색 도구에서 경쟁력이 있음을 시사합니다. 특히, 엄격한 구조를 가진 의료 문서 분류 작업에서는 이러한 경향이 더욱 두드러집니다.
시사점, 한계점
•
시사점:
◦
신경망 기반 벡터 검색이 항상 최고의 성능을 보장하는 것은 아님을 보여줌.
◦
전통적인 어휘 기반 벡터 검색 방식의 실용성과 경쟁력을 재확인.
◦
특정 문제 영역(예: 엄격한 구조의 의료 문서)에서는 전통적인 방법이 더 효율적일 수 있음을 제시.