본 논문은 대규모 언어 모델(LLM) 기반 질의응답(QA) 시스템을 향상시키기 위해 지식 기반을 구조화하는 데 중요한 역할을 하는 온톨로지 자동 생성 파이프라인인 OntoRAG를 제시합니다. 기존의 수동 온톨로지 생성 방식의 한계를 극복하고자 웹 스크래핑, PDF 파싱, 하이브리드 청킹, 정보 추출, 지식 그래프 생성 및 온톨로지 생성 등의 기술을 통합하여 비정형 데이터(전기 계전기 문서에 초점)를 질의 가능한 온톨로지로 변환합니다. LLM과 그래프 기반 방법을 활용하여 기존의 RAG 및 GraphRAG 접근 방식보다 포괄성과 다양성이 향상된 글로벌 의미 이해 능력을 강화합니다. 실험 결과, OntoRAG는 벡터 RAG에 대해 85%, GraphRAG 최적 구성에 대해 75%의 포괄성 승률을 달성하여 효과를 입증했습니다. 이 연구는 온톨로지 자동 생성의 과제를 해결하고 의미 웹의 비전을 발전시키는 데 기여합니다.