दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मेडजेम्मा तकनीकी रिपोर्ट

Created by
  • Haebom

लेखक

एंड्रयू सेलरग्रेन, सहर काज़ेमज़ादेह, तियाम जारोन्स्री, एटिला किराली, मेडेलीन ट्रैवर्स, टिमो कोह्लबर्गर, शॉन जू, फ़याज़ जमील, सियान ह्यूजेस, चार्ल्स लाउ, जस्टिन चेन, फ़रेशतेह महवर, लिरोन यात्ज़िव, टिफ़नी चेन, ब्रैम स्टर्लिंग, स्टेफ़नी अन्ना बेबी, सुज़ाना मारिया बेबी, जेरेमी लाई, सैमुअल श्मिडगल, लू यांग, केजिया चेन, पेर ब्योर्नसन, शशीर रेड्डी, रयान ब्रश, केनेथ फिलब्रिक, हॉवर्ड हू, हॉवर्ड यांग, ऋचा तिवारी, सनी जानसेन, प्रीति सिंह, युन लियू, शेकूफेह अज़ीज़ी, ऐश्वर्या कामथ, जोहान फेर्रेट, श्रेया पाठक, नीनो विइलार्ड, रमोना मरहेज, सारा पेरिन, तातियाना माटेजोविकोवा, एलेक्जेंडर राम ई, मॉर्गन रिविएर, लुइस रूइलार्ड, थॉमस मेस्नार्ड, जेफ्री साइडरॉन, जीन-बास्टियन ग्रिल, सबेला रामोस, एडौर्ड यविनेक, मिशेल कैसबन, एलेना बुचात्सकाया, जीन-बैप्टिस्ट अलायराक, दिमित्री लेपिखिन, व्लाद फीनबर्ग, सेबेस्टियन बोरग्यूड, एलेक एंड्रीव, कैसिडी हार्डिन, रॉबर्ट दादाशी, लियोनार्ड हुसेनोट, आर्मंड जौलिन, ओलिवर बाकेम, योसी मटियास, कैथरीन चाउ, अविनातन हसीदीम, कवि गोयल, क्लेमेंट फ़राबेट, जोएल बर्राल, ट्रिस वार्केंटिन, जोनाथन श्लेन्स, डेविड फ्लीट, विक्टर कोटरुटा, उमर सेन्सेविएरो, गस मार्टिंस, फोएबे किर्क, आनंद राव, श्रव्या शेट्टी, डेविड एफ. स्टीनर, कैन किर्मिज़िबायरक, रोरी पिलग्रिम, डैनियल गोल्डन, लिन यांग

रूपरेखा

मेडजेम्मा, जेम्मा 3 4B और 27B पर आधारित चिकित्सा छवि-भाषा मॉडलों का एक संग्रह है। स्वास्थ्य सेवा में कृत्रिम बुद्धिमत्ता (AI) के विकास की चुनौतियों, जैसे विविध चिकित्सा डेटा, जटिल कार्यों और गोपनीयता की आवश्यकता, का समाधान करने के लिए, हम एक आधार मॉडल प्रस्तुत करते हैं जो कार्य-विशिष्ट ट्यूनिंग डेटा की कम मात्रा वाले चिकित्सा कार्यों पर अच्छा प्रदर्शन करता है। मेडजेम्मा छवियों और पाठ के लिए उन्नत चिकित्सा समझ और तर्क क्षमताओं को प्रदर्शित करता है, समान आकार के जनरेटिव मॉडलों की तुलना में उल्लेखनीय रूप से बेहतर प्रदर्शन करता है और कार्य-विशिष्ट मॉडलों के प्रदर्शन के करीब पहुँचता है। यह जेम्मा 3-आधारित मॉडलों की सामान्य क्षमताओं को बनाए रखते हुए, आउट-ऑफ-डिस्ट्रीब्यूशन कार्यों (चिकित्सा बहुविध प्रश्न-उत्तर में 2.6-10%, वक्षीय Xलाइन निष्कर्ष वर्गीकरण में 15.5-18.1%, और एजेंट मूल्यांकन में 10.8%) पर मौजूदा मॉडलों की तुलना में प्रदर्शन में भी सुधार करता है। फ़ाइन-ट्यूनिंग के माध्यम से, हम उप-डोमेन में प्रदर्शन को और बेहतर बनाते हैं, जिससे फेफड़ों के हर्नियेशन वर्गीकरण और हिस्टोपैथोलॉजी पैच वर्गीकरण का प्रदर्शन मौजूदा अत्याधुनिक विधियों के बराबर हो जाता है। हम मेडसिग्लिप भी पेश करते हैं, जो चिकित्सा उपयोग के लिए तैयार किया गया एक विज़न एनकोडर है, जो मेडजेम्मा की दृश्य समझ क्षमताओं को सशक्त बनाता है और विशिष्ट चिकित्सा छवि एनकोडर के बराबर या उससे बेहतर प्रदर्शन प्रदान करता है। मेडजेम्मा शक्तिशाली चिकित्सा छवि और पाठ क्षमताओं के लिए एक आधार प्रदान करता है जो चिकित्सा अनुसंधान और डाउनस्ट्रीम अनुप्रयोग विकास को महत्वपूर्ण रूप से गति प्रदान करने की क्षमता रखता है।

Takeaways, Limitations

Takeaways:
यह चिकित्सा छवि और भाषा समझ के लिए एक शक्तिशाली आधार मॉडल प्रदान करके चिकित्सा एआई के विकास को गति दे सकता है।
यह कम मात्रा में डेटा के साथ विभिन्न प्रकार के चिकित्सा कार्यों के लिए बहुमुखी प्रतिभा प्रदान करता है।
यह मौजूदा विशिष्ट कार्य मॉडलों से बेहतर प्रदर्शन करता है या उनके करीब पहुंचता है, तथा वितरण के बाहर के कार्यों में भी प्रदर्शन में सुधार दिखाता है।
फाइन-ट्यूनिंग से विशिष्ट चिकित्सा उप-डोमेन में प्रदर्शन में और सुधार हो सकता है।
मेडसिग्लिप ने चिकित्सा छवि एन्कोडिंग के लिए एक नया मानक स्थापित किया है।
Limitations:
इस पेपर में Limitations या बाधाओं के विशिष्ट संदर्भों का अभाव है।
मॉडल की सामान्यीकरण क्षमता का आगे मूल्यांकन आवश्यक हो सकता है।
बड़े पैमाने पर वास्तविक दुनिया के चिकित्सा डेटासेट का उपयोग करके अतिरिक्त सत्यापन की आवश्यकता है।
चिकित्सा नैतिकता और गोपनीयता के मुद्दों पर गहन चर्चा की आवश्यकता है।
👍