दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मेडिकल स्कूल के पाठ्यक्रम में अनुचित भाषा का एआई-संचालित पता लगाना

Created by
  • Haebom

लेखक

चिमन सलावती, शैनन सॉन्ग, स्कॉट ए. हेल, रॉबर्टो ई. मोंटेनेग्रो, शिरी डोरी-हाकोहेन, फैब्रिकियो मुराई

रूपरेखा

यह शोधपत्र चिकित्सा शिक्षा सामग्री में अनुपयुक्त भाषा (आईयूएल) की स्वचालित पहचान के लिए एक लघु भाषा मॉडल (एसएलएम) और एक पूर्व-प्रशिक्षित वृहद भाषा मॉडल (एलएलएम) के प्रदर्शन का मूल्यांकन करता है। लगभग 500 दस्तावेज़ों (12,000 से अधिक पृष्ठों) के डेटासेट का उपयोग करते हुए, हमने विभिन्न एसएलएम मॉडलों की तुलना की, जिनमें एक आईयूएल सामान्य वर्गीकारक, एक उपश्रेणी-विशिष्ट द्विआधारी वर्गीकारक, एक बहु-लेबल वर्गीकारक, और एक पदानुक्रमित पाइपलाइन, साथ ही कई प्रॉम्प्ट विविधताओं वाला एक एलएलएम (लामा-3 8बी और 70बी) शामिल है। परिणामों से पता चला कि सावधानीपूर्वक निर्मित शॉट्स का उपयोग करते हुए एसएलएम ने एलएलएम से काफी बेहतर प्रदर्शन किया, और विशेष रूप से, अनुपयुक्त भाषा से रहित अनुभागों में नकारात्मक उदाहरणों पर प्रशिक्षित उपश्रेणी-विशिष्ट द्विआधारी वर्गीकारक ने सबसे अच्छा प्रदर्शन किया।

Takeaways, Limitations

Takeaways:
हम बताते हैं कि चिकित्सा शिक्षा सामग्री में अनुचित भाषा के प्रयोग की स्वचालित रूप से पहचान करने में एसएलएम, एलएलएम की तुलना में अधिक प्रभावी है।
विशेष रूप से, अनुचित भाषा के प्रयोग के बिना भाषण उदाहरणों का उपयोग करके प्रशिक्षित उपश्रेणी बाइनरी क्लासिफायर ने उच्च प्रदर्शन दिखाया।
एसएलएम-आधारित स्वचालित प्रणाली के माध्यम से चिकित्सा शिक्षा सामग्री की गुणवत्ता में सुधार लाने और पक्षपात को समाप्त करने में योगदान देने की संभावना का सुझाव देना।
Limitations:
अध्ययन में प्रयुक्त डेटासेट का आकार अपेक्षाकृत छोटा हो सकता है।
यह संभव है कि हमने सभी प्रकार के अनुचित भाषा प्रयोग को कवर नहीं किया हो।
वास्तविक चिकित्सा शिक्षा सेटिंग्स में अनुप्रयोग के लिए आगे अनुसंधान और सत्यापन की आवश्यकता है।
एलएलएम प्रदर्शन में गिरावट के कारणों के गहन विश्लेषण का अभाव।
👍