यह पत्र आइटम प्रतिक्रिया सिद्धांत (आईआरटी) आधारित शैक्षिक आकलन में उच्च गुणवत्ता वाले आइटम विकसित करने के महत्व पर प्रकाश डालता है और पारंपरिक, संसाधन-गहन पूर्व-परीक्षण विधि की जगह आइटम-लेखन दोष (आईडब्ल्यूएफ) विश्लेषण का उपयोग करके एक कुशल आइटम सत्यापन विधि का प्रस्ताव करता है। हमने 19 मानदंडों के आधार पर 7,126 बहुविकल्पीय STEM आइटम पर स्वचालित IWF विश्लेषण किया और IRT कठिनाई और भेदभाव सूचकांकों के साथ उनके सहसंबंधों का विश्लेषण किया। परिणामों ने IWF की संख्या और IRT कठिनाई और भेदभाव सूचकांकों के बीच महत्वपूर्ण सहसंबंधों का खुलासा किया, विशेष रूप से जीवन/पृथ्वी विज्ञान और भौतिक विज्ञान में। इसके अलावा, हमने पाया कि विशिष्ट IWF मानदंड (जैसे, नकारात्मक शब्दावली का उपयोग बनाम अवास्तविक गलत उत्तर विकल्प) का आइटम की गुणवत्ता और कठिनाई पर अलग-अलग प्रभाव पड़ा हालाँकि, हम डोमेन-विशिष्ट मूल्यांकन मानदंडों और एल्गोरिदम की सीमाओं पर भी प्रकाश डालते हैं, साथ ही डोमेन-विशिष्ट विशेषताओं पर विचार करने वाले आगे के शोध की आवश्यकता पर भी प्रकाश डालते हैं।