यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
प्रॉम्प्ट4ट्रस्ट: मल्टीमॉडल लार्ज लैंग्वेज मॉडल्स में चिकित्सकीय रूप से संरेखित आत्मविश्वास अंशांकन के लिए एक सुदृढीकरण अधिगम प्रॉम्प्ट संवर्द्धन ढांचा
Created by
Haebom
लेखक
अनीता क्रिज़, एलिजाबेथ लौरा जेन्स, जिंग शेन, ताल अर्बेल
रूपरेखा
यह पत्र मल्टीमॉडल बड़े पैमाने पर भाषा मॉडल (एमएलएलएम) के दो प्रमुख Limitations पर केंद्रित है, जिनमें स्वास्थ्य सेवा में उपयोग की उच्च क्षमता है: (i) संकेत डिजाइन के प्रति उनकी संवेदनशीलता और (ii) उच्च आत्मविश्वास के साथ गलत प्रतिक्रियाएं उत्पन्न करने की उनकी प्रवृत्ति। चूंकि स्वास्थ्य देखभाल पेशेवर मॉडल की विश्वसनीयता का आकलन करने के लिए मॉडल द्वारा व्यक्त किए गए आत्मविश्वास के स्तर पर भरोसा कर सकते हैं, इसलिए यह विशेष रूप से महत्वपूर्ण है कि मॉडल उच्च आत्मविश्वास व्यक्त करते समय उच्च सटीकता बनाए रखे। इसलिए, इस पत्र में, हम Prompt4Trust प्रस्तुत करते हैं, जो MLLM के विश्वास अंशांकन को लक्षित करने वाले शीघ्र वृद्धि के लिए पहला सुदृढीकरण सीखने (RL) ढांचा है। हम संदर्भ-जागरूक सहायक संकेत उत्पन्न करने के लिए एक हल्के LLM को प्रशिक्षित करते हैं जो उप-कार्य MLLM को ऐसी प्रतिक्रियाएं उत्पन्न करने के लिए प्रेरित करते हैं इन चिकित्सकीय रूप से प्रेरित अंशांकन उद्देश्यों के अतिरिक्त, प्रस्तावित विधि PMC-VQA बेंचमार्क पर अत्याधुनिक चिकित्सा दृश्य प्रश्नोत्तर (VQA) प्रदर्शन प्राप्त करके कार्य सटीकता में भी सुधार करती है, जिसमें विभिन्न चिकित्सा छवि विधाओं को कवर करने वाले बहुविकल्पीय प्रश्न शामिल होते हैं। इसके अलावा, छोटे पैमाने के उप-कार्य MLLM पर प्रशिक्षित यह ढाँचा प्रयोगों में बड़े पैमाने के MLLM के लिए आशाजनक शून्य-शॉट सामान्यीकरण प्रदर्शित करता है, जो संबंधित कम्प्यूटेशनल लागत के बिना स्केलेबल अंशांकन की क्षमता का सुझाव देता है। यह कार्य सुरक्षा-महत्वपूर्ण वातावरणों में MLLM की विश्वसनीयता में सुधार के लिए स्वचालित किन्तु मानव-चालित त्वरित इंजीनियरिंग की क्षमता को प्रदर्शित करता है। कोडबेस https://github.com/xingbpshen/prompt4trust पर पाया जा सकता है ।