본 논문은 독자의 정보 탐구 욕구인 독서 호기심을 자연어 처리(NLP) 관점에서 모델링하는 새로운 프레임워크를 제시합니다. Loewenstein의 정보 격차 이론을 바탕으로, 텍스트의 의미 구조 내 의미론적 정보 격차를 정량화하여 독서 호기심을 측정합니다. BERTopic 기반 토픽 모델링과 지속적 호몰로지(persistent homology)를 활용하여 텍스트 세그먼트에서 유도된 동적 의미 네트워크의 위상 구조(연결 요소, 순환, 공극)를 분석하고, 이러한 특징들을 정보 격차의 대리 지표로 활용합니다. 실험적으로는 참가자 49명을 대상으로 S. Collins의 "헝거 게임" 소설에 대한 독서 호기심 평가를 수집하고, 개발한 파이프라인의 위상적 특징을 독립 변수로 사용하여 이러한 평가를 예측하는 모델을 구축했습니다. 결과적으로, 기준 모델(설명된 분산 30%)에 비해 독서 호기심 예측 성능이 유의미하게 향상(설명된 분산 73%)됨을 보여주며, 제시된 방법의 유효성을 검증했습니다. 본 연구는 텍스트 구조와 독자 참여의 관계를 분석하는 새로운 계산 방법을 제공합니다.