Sign In

Q-Sat AI: Machine Learning-Based Decision Support for Data Saturation in Qualitative Studies

Created by
  • Haebom
Category
Empty

저자

Hasan Tutar, Caner Erden, Umit \c{S}enturk

개요

본 연구는 질적 연구의 표본 크기 결정을 보다 객관적으로 만들기 위해 머신 러닝(ML) 기반의 새로운 체계적인 모델을 제시합니다. 사례 연구, 근거 이론, 현상학, 내러티브 연구, 민족지학 연구 등 5가지 질적 연구 접근 방식을 기반으로 한 데이터 세트를 활용하여 앙상블 학습 모델을 개발했습니다. 연구 범위, 정보력, 연구자 역량 등 10가지 중요한 매개변수를 사용하여 입력 특징으로 활용했습니다. 다양한 ML 알고리즘을 훈련하고 비교한 결과, K-최근접 이웃(KNN), 그래디언트 부스팅(GB), 랜덤 포레스트(RF), XGBoost, 의사 결정 트리(DT) 알고리즘이 가장 높은 설명력을 보였습니다(Test R2 ~ 0.85). 본 연구는 질적 연구자, 저널 심사자 및 논문 지도 교수를 위한 의사 결정 지원 시스템 역할을 하는 웹 기반 계산 응용 프로그램의 개념적 프레임워크를 제안하며, 증거 기반의 체계적인 의사 결정을 통해 표본 크기 정당성을 표준화하고 투명성을 강화하며 질적 연구의 인식론적 기초를 강화하는 것을 목표로 합니다.

시사점, 한계점

머신 러닝 모델을 활용하여 질적 연구의 표본 크기 결정을 객관화하고, 데이터 포화라는 주관적인 기준을 대체할 수 있는 방법을 제시함.
다양한 질적 연구 방법론(사례 연구, 근거 이론 등)에 적용 가능한 모델을 개발하여 방법론적 적용 범위를 넓힘.
연구 설계 유형 및 정보력과 같은 핵심 요소의 중요성을 정량적으로 확인하여 질적 연구 방법론의 이론적 가정을 뒷받침함.
웹 기반 의사 결정 지원 시스템의 개념적 프레임워크를 제시하여 실질적인 활용 가능성을 제시함.
데이터 세트가 5가지 연구 접근법으로 제한되어 있어 다른 질적 연구 방법론으로의 일반화에 한계가 있을 수 있음.
모델의 정확도(R2 ~ 0.85)가 높지만, 여전히 불확실성이 존재하며 추가적인 검증이 필요함.
10가지 매개변수 외에 다른 중요한 요소를 고려하지 못했을 수 있음.
👍