Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

A Hybrid AI Methodology for Generating Ontologies of Research Topics from Scientific Paper Corpora

Created by
  • Haebom

저자

Alessia Pisu, Livio Pompianu, Francesco Osborne, Diego Reforgiato Recupero, Daniele Riboni, Angelo Salatino

개요

본 논문은 연구 주제 온톨로지 생성을 위한 반자동화 방법론인 Sci-OG를 제시합니다. Sci-OG는 연구 논문에서 잠재적 주제를 추출하는 주제 발견, 주제 쌍 간의 의미 관계를 결정하는 관계 분류, 그리고 구조화된 온톨로지로 주제를 정제 및 구성하는 온톨로지 구성의 세 단계로 구성됩니다. 특히 관계 분류 단계는 인코더 기반 언어 모델과 과학 문헌에서 주제 발생을 설명하는 특징을 통합합니다. 21,649개의 수동 주석이 달린 의미 트리플 데이터셋을 사용하여 다양한 대안 솔루션과 비교 평가한 결과, Sci-OG는 최고의 F1 점수(0.951)를 달성하여 미세 조정된 SciBERT 모델 및 미세 조정된 GPT4-mini와 같은 여러 LLM 기준 모델을 능가했습니다. 사이버 보안 분야에서 CSO 온톨로지를 확장하는 활용 사례를 통해 시스템의 실용적인 적용을 보여줍니다. 이 방법론은 AI 기반 문헌 관리 및 연구 탐색의 발전을 지원하여 과학 지식의 접근성, 구성 및 분석을 향상시키도록 설계되었습니다.

시사점, 한계점

시사점:
기존의 수동 방식보다 효율적이고 정확하게 연구 주제 온톨로지를 생성할 수 있는 반자동화 방법론 제시.
인코더 기반 언어 모델과 문헌 통계 특징을 결합하여 높은 정확도(F1 score 0.951) 달성.
사이버 보안 분야 CSO 온톨로지 확장 등 실제 적용 가능성을 보여줌.
AI 기반 문헌 관리 및 연구 탐색 기술 발전에 기여.
한계점:
사용된 데이터셋의 크기와 특성에 따라 성능이 달라질 수 있음.
새로운 연구 분야나 특수 용어에 대한 적응력에 대한 추가 연구 필요.
온톨로지 생성 과정의 투명성 및 설명 가능성 향상 필요.
다양한 언어에 대한 지원 및 확장성 검증 필요.
👍