Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Persistent Homology of Topic Networks for the Prediction of Reader Curiosity

Created by
  • Haebom

저자

Manuel D. S. Hopp (LIA), Vincent Labatut (LIA), Arthur Amalvy (LIA), Richard Dufour (LS2N - equipe TALN), Hannah Stone, Hayley Jach, Kou Murayama

개요

본 논문은 독자의 정보 탐구 욕구인 독서 호기심을 자연어 처리(NLP) 관점에서 모델링하는 새로운 프레임워크를 제시합니다. Loewenstein의 정보 격차 이론을 바탕으로, 텍스트의 의미 구조 내 의미론적 정보 격차를 정량화하여 독서 호기심을 측정합니다. BERTopic 기반 토픽 모델링과 지속적 호몰로지(persistent homology)를 활용하여 텍스트 세그먼트에서 유도된 동적 의미 네트워크의 위상 구조(연결 요소, 순환, 공극)를 분석하고, 이러한 특징들을 정보 격차의 대리 지표로 활용합니다. 실험적으로는 참가자 49명을 대상으로 S. Collins의 "헝거 게임" 소설에 대한 독서 호기심 평가를 수집하고, 개발한 파이프라인의 위상적 특징을 독립 변수로 사용하여 이러한 평가를 예측하는 모델을 구축했습니다. 결과적으로, 기준 모델(설명된 분산 30%)에 비해 독서 호기심 예측 성능이 유의미하게 향상(설명된 분산 73%)됨을 보여주며, 제시된 방법의 유효성을 검증했습니다. 본 연구는 텍스트 구조와 독자 참여의 관계를 분석하는 새로운 계산 방법을 제공합니다.

시사점, 한계점

시사점:
텍스트의 의미론적 정보 격차를 정량화하여 독서 호기심을 측정하는 새로운 프레임워크 제시
BERTopic과 지속적 호몰로지를 활용한 혁신적인 접근 방식 제시
텍스트 구조 분석과 독자 참여 연구에 새로운 계산 방법 제공
기존 모델 대비 독서 호기심 예측 성능 향상 (설명된 분산 73% vs 30%)
한계점:
"헝거 게임" 단일 소설 데이터를 사용한 실험으로 일반화 가능성에 대한 추가 연구 필요
참가자 수 (n=49)가 상대적으로 적어 결과의 일반화 가능성에 대한 제한 존재
다양한 장르 및 텍스트 유형에 대한 추가 실험 필요
정보 격차 이론에 대한 의존성으로, 다른 독서 참여 요인 고려 필요성 존재
👍