दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

इनपुट-संचालित सलूशन अनुकूलन के माध्यम से ऑन-डिवाइस मेडिकल एआई सहायकों को सक्षम करना

Created by
  • Haebom

लेखक

उत्तेज कल्लाकुरिक, एडवर्ड ह्यूम्स, ऋत्विक जोना, ज़ियाओमिन लिन, टीनोश मोहसिनिन

रूपरेखा

यह शोधपत्र संसाधन-सीमित परिवेशों, जैसे कि रीयल-टाइम स्वास्थ्य सेवा, में बड़े पैमाने के भाषा मॉडल (LLM) को परिनियोजित करने के लिए एक नवीन चिकित्सा सहायता प्रणाली प्रस्तुत करता है। एक सामान्य-उद्देश्य संपीड़न ढाँचे का उपयोग करके अनुकूलित, यह प्रणाली LLM को विशिष्ट डोमेन के अनुरूप बनाती है। डोमेन-विशिष्ट डेटा पर न्यूरॉन के महत्व को मापकर, यह अप्रासंगिक न्यूरॉन्स को प्रभावी ढंग से हटाता है, जिससे मॉडल का आकार कम होता है और प्रदर्शन बना रहता है। इसके बाद, प्रशिक्षण के बाद क्वांटिज़ेशन का उपयोग मेमोरी उपयोग को और कम करने के लिए किया जाता है, और संपीड़ित मॉडलों का मूल्यांकन MedMCQA, MedQA और PubMedQA सहित स्वास्थ्य सेवा मानकों पर किया जाता है। इसके अलावा, हम एक Jetson Orin Nano और एक Raspberry Pi 5 पर 50% संपीड़ित Gemma मॉडल और 67% संपीड़ित LLaMA3 मॉडल परिनियोजित करते हैं, जिससे हार्डवेयर सीमाओं के अंतर्गत रीयल-टाइम, ऊर्जा-कुशल अनुमान प्राप्त होता है।

Takeaways, Limitations

Takeaways:
संसाधन-सीमित वातावरण में भी एलएलएम का उपयोग करके वास्तविक समय चिकित्सा सहायता प्रणाली को लागू करने की संभावना प्रस्तुत करना।
न्यूरॉन महत्व माप पर आधारित एक प्रभावी मॉडल संपीड़न तकनीक का प्रस्ताव।
हम एक संपीड़ित मॉडल का उपयोग करके वास्तविक हार्डवेयर (जेटसन ओरिन नैनो, रास्पबेरी पाई 5) पर वास्तविक समय अनुमान का एक सफल केस अध्ययन प्रस्तुत करते हैं।
ऊर्जा-कुशल चिकित्सा एलएलएम वितरण योजना प्रस्तुत करना।
Limitations:
प्रस्तावित संपीड़न ढांचे की सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
विभिन्न चिकित्सा डेटासेट और नैदानिक वातावरण में प्रदर्शन सत्यापन आवश्यक है।
संपीड़न प्रक्रिया के दौरान होने वाली प्रदर्शन गिरावट का अधिक विस्तृत विश्लेषण आवश्यक है।
विशिष्ट हार्डवेयर के लिए अनुकूलन के कारण अन्य हार्डवेयर प्लेटफार्मों के लिए मापनीयता संबंधी समस्याएं।
👍