본 논문은 데이터 과학자들의 주요 코딩 도구인 Jupyter Notebook의 코드 품질, 특히 이해도에 대한 연구를 다룹니다. 기존의 이해도 평가 방식이 설문조사나 좋아요/투표 수 등의 제한적인 메타데이터에 의존하는 한계를 극복하고자, 소프트웨어 저장소의 사용자 의견을 활용하는 새로운 접근 방식을 제안합니다. DistilKaggle 데이터셋의 542,051개 Kaggle Jupyter Notebook을 대상으로, 미세 조정된 DistilBERT 변환기를 사용하여 코드 이해도 관련 사용자 의견을 식별하고, 사용자 의견 코드 이해도(UOCU)라는 새로운 지표를 제시합니다. UOCU는 관련 댓글 수, 추천 수, 노트북 조회 수를 기반으로 하며, 기존 방식보다 효과적임을 보였습니다. UOCU와 전체 추천 수를 결합한 하이브리드 접근 방식을 통해 개선된 지표를 사용하여 132,723개의 노트북에서 34개의 노트북 수준 지표를 수집하고, 머신러닝 모델을 훈련하여 노트북 코드의 이해도를 예측했습니다. Random Forest 분류기가 89%의 정확도를 달성하였으며, 이는 사용자 의견 신호와 노트북 지표가 코드 이해도의 확장 가능하고 정확한 측정에 중요함을 보여줍니다.