Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Hierarchical Retrieval with Out-Of-Vocabulary Queries: A Case Study on SNOMED CT

Created by
  • Haebom
Category
Empty

저자

Jonathon Dilworth, Hui Yang, Jiaoyan Chen, Yongsheng Gao

개요

SNOMED CT는 대규모 개념의 계층적 표현을 가진 생물의학 온톨로지이다. SNOMED CT 내 지식 검색은 중요하지만, 언어의 모호성, 동의어, 다의어 등으로 인해 어려움이 있다. 특히, 쿼리가 온톨로지에 일치하는 항목이 없는 OOV(Out-of-Vocabulary)일 때 문제가 심화된다. 본 연구에서는 OOV 쿼리를 사용한 SNOMED CT에서 계층적 개념 검색 문제를 해결하고자, 언어 모델 기반 온톨로지 임베딩을 기반으로 하는 접근 방식을 제안한다. SBERT 및 두 가지 어휘 매칭 방법을 포함한 기본 모델보다 성능이 우수함을 확인했다. 본 연구의 접근 방식은 SNOMED CT에 적용되었지만, 다른 온톨로지로 일반화될 수 있다.

시사점, 한계점

OOV 쿼리를 사용하여 SNOMED CT에서 계층적 개념 검색 문제를 해결하는 새로운 방법 제안
언어 모델 기반 온톨로지 임베딩을 활용하여 기존 방법보다 향상된 성능 달성
SNOMED CT에 국한되지 않고 다른 온톨로지에도 적용 가능한 일반적인 방법론 제시
Github을 통해 코드, 도구, 평가 데이터셋 공개
연구가 SNOMED CT에 초점을 맞추고 있어 다른 온톨로지에 대한 일반화 성능은 추가적인 연구가 필요함
👍