दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

हनीबी: आधारभूत एम्बेडिंग मॉडल के साथ मल्टीमॉडल ऑन्कोलॉजी डेटासेट बनाने के लिए एक स्केलेबल मॉड्यूलर फ्रेमवर्क

Created by
  • Haebom

लेखक

आकाश त्रिपाठी, असीम वकास, मैथ्यू बी शबाथ, यासीन यिलमाज़, गुलाम रसूल

रूपरेखा

HONeYBEE ऑन्कोलॉजी अनुप्रयोगों के लिए एक ओपन-सोर्स मल्टीमॉडल बायोमेडिकल डेटा इंटीग्रेशन फ्रेमवर्क है। यह संरचित और असंरचित नैदानिक ​​डेटा, संपूर्ण-स्लाइड छवियों, रेडियोलॉजी स्कैन और आणविक प्रोफाइल को संसाधित करता है, और डोमेन-विशिष्ट आधार मॉडल और फ़्यूज़न रणनीतियों का उपयोग करके एकीकृत रोगी-स्तरीय एम्बेडिंग उत्पन्न करता है। ये एम्बेडिंग उत्तरजीविता पूर्वानुमान, कैंसर प्रकार वर्गीकरण, रोगी समानता पुनर्प्राप्ति और कोहोर्ट क्लस्टरिंग को सक्षम बनाते हैं। TCGA से 33 प्रकार के कैंसरों में 11,400 से अधिक रोगियों पर मूल्यांकन करने पर, नैदानिक ​​एम्बेडिंग ने सबसे मज़बूत यूनिमॉडल प्रदर्शन प्रदर्शित किया, जिसमें 98.5% वर्गीकरण सटीकता और रोगी पुनर्प्राप्ति के लिए 10% पर 96.4% परिशुद्धता थी। इसने अधिकांश कैंसर प्रकारों में उच्चतम उत्तरजीविता पूर्वानुमान अनुरूपता सूचकांक भी प्राप्त किया। मल्टीमॉडल फ़्यूज़न विशिष्ट कैंसरों के लिए पूरक लाभ प्रदान करता है, जिससे समग्र उत्तरजीविता पूर्वानुमान में सुधार होता है, जो केवल नैदानिक ​​विशेषताओं से प्राप्त नहीं हो सकता। चार बड़े पैमाने के भाषा मॉडलों के तुलनात्मक मूल्यांकन से पता चलता है कि क्वेन3 जैसे सामान्य प्रयोजन मॉडल, पैथोलॉजी रिपोर्ट जैसे विषम डेटा पर कार्य-विशिष्ट फाइन-ट्यूनिंग प्रदर्शन में सुधार करते हैं, लेकिन नैदानिक ​​पाठ प्रतिनिधित्व पर विशेष चिकित्सा मॉडल से बेहतर प्रदर्शन करते हैं।

Takeaways, Limitations

Takeaways: ऑन्कोलॉजी अनुसंधान और पूर्वानुमान प्रदर्शन को बेहतर बनाने के लिए विभिन्न चिकित्सा डेटा विधियों को एकीकृत करने हेतु एक प्रभावी ढाँचा प्रस्तुत करता है। विशेष रूप से, हम नैदानिक ​​डेटा-आधारित एम्बेडिंग के उत्कृष्ट प्रदर्शन को प्रदर्शित करते हैं। हम मल्टीमॉडल फ़्यूज़न के माध्यम से उत्तरजीविता पूर्वानुमान में सुधार की क्षमता प्रदर्शित करते हैं। हम चिकित्सा डेटा प्रसंस्करण के लिए एक सामान्य-उद्देश्य एलएलएम के प्रदर्शन को भी प्रमाणित करते हैं।
Limitations: TCGA डेटासेट पर निर्भरता। अन्य डेटासेट पर इसकी सामान्यता की पुष्टि आवश्यक है। कुछ प्रकार के कैंसर के लिए मल्टीमॉडल फ़्यूज़न की प्रभावशीलता सीमित हो सकती है। मॉडल की व्याख्यात्मकता और व्याख्यात्मक क्षमता निर्धारित करने के लिए और अधिक शोध की आवश्यकता है।
👍