본 논문은 7,000개 이상의 다지선다형 과학기술공학수학(STEM) 과목 문제를 대상으로, 문항작성오류(IWF) 기준과 항목반응이론(IRT) 매개변수 간의 관계를 분석한 연구입니다. 자동화된 접근 방식을 사용하여 19개 기준의 IWF 척도로 각 문제에 주석을 달고, IWF 수와 IRT 난이도 및 변별도 매개변수 간의 통계적으로 유의미한 연관성을 밝혔습니다. 특히 생명과학 및 물리과학 분야에서 이러한 연관성이 더욱 두드러졌으며, 특정 IWF 기준이 항목 품질에 미치는 영향의 정도가 다름을 확인했습니다 (예: 부정적 어휘 사용 vs. 비현실적인 오답 선지). 결론적으로 IWF는 특히 낮은 난이도의 문제 선별에 유용하지만, 기존의 데이터 기반 검증 방법을 대체할 수는 없다는 점을 강조하고 있습니다. 향후 도메인 일반적 평가 척도 및 도메인 특정 콘텐츠를 이해하는 알고리즘에 대한 연구 필요성을 제시합니다.