दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ट्रेस करने योग्य डायग्नोस्टिक रीजनिंग के लिए एंड-टू-एंड एजेंटिक आरएजी सिस्टम प्रशिक्षण

Created by
  • Haebom

लेखक

क़ियाओयू झेंग, युज़े सन, चाओई वू, वेइके झाओ, पेंगचेंग किउ, योंगगुओ यू, कुन सन, यानफ़ेंग वांग, या झांग, वेइदी झी

रूपरेखा

बड़े पैमाने के चिकित्सा भाषा मॉडलों का सटीक निदान ज्ञान के अंतराल और मतिभ्रमों के कारण बाधित होता है। हालाँकि पुनर्प्राप्ति और उपकरण संवर्द्धन विधियाँ सहायक हैं, लेकिन बाह्य ज्ञान के कम उपयोग और प्रतिक्रिया अनुमान की खराब पता लगाने योग्यता के कारण उनका प्रभाव सीमित है। इन चुनौतियों का समाधान करने के लिए, यह अध्ययन डीप-डीएक्ससर्च प्रस्तुत करता है, जो सुदृढीकरण अधिगम (आरएल) का उपयोग करते हुए एक अंत-से-अंत प्रशिक्षित एजेंट-आरएजी प्रणाली है। यह प्रणाली चिकित्सा निदान में पता लगाने योग्य पुनर्प्राप्ति-संवर्धित अनुमान लागू करती है। डीप-डीएक्ससर्च एक विशाल चिकित्सा पुनर्प्राप्ति कोष का निर्माण करता है जिसमें रोगी रिकॉर्ड और विश्वसनीय चिकित्सा ज्ञान स्रोत शामिल होते हैं ताकि नैदानिक ​​परिदृश्यों में पुनर्प्राप्ति-जागरूक अनुमान का समर्थन किया जा सके। बड़े पैमाने के डेटा पर आरएल का उपयोग करके एजेंट-आरएजी नीति विकसित करना महत्वपूर्ण है, जिसमें एलएलएम मुख्य एजेंट और पुनर्प्राप्ति कोष परिवेश के रूप में हो, और प्रारूप, पुनर्प्राप्ति, अनुमान संरचना और नैदानिक ​​सटीकता के लिए अनुकूलित पुरस्कार हों। प्रायोगिक परिणाम दर्शाते हैं कि एंड-टू-एंड एजेंट-आरएजी प्रशिक्षण ढाँचा, कई डेटा केंद्रों में प्रॉम्प्ट-इंजीनियर्ड और प्रशिक्षण-मुक्त आरएजी दृष्टिकोणों से लगातार बेहतर प्रदर्शन करता है। प्रशिक्षण के बाद, डीप-डीएक्ससर्च ने सामान्य और दुर्लभ, दोनों प्रकार की बीमारियों के निदान में नैदानिक ​​सटीकता में उल्लेखनीय सुधार किया, और इन-डिस्ट्रीब्यूशन और आउट-ऑफ-डिस्ट्रीब्यूशन, दोनों ही स्थितियों में, जीपीटी-4o, डीपसीक-आर1, और अन्य स्वास्थ्य-विशिष्ट ढाँचों जैसे मज़बूत नैदानिक ​​मानकों से बेहतर प्रदर्शन किया। इसके अलावा, रिवॉर्ड डिज़ाइन और सर्च कॉर्पस घटकों पर एब्लेशन अध्ययनों ने पारंपरिक कार्यान्वयनों की तुलना में इस दृष्टिकोण की विशिष्टता और प्रभावशीलता को उजागर करने में अपनी महत्वपूर्ण भूमिका की पुष्टि की। अंत में, केस स्टडी और व्याख्यात्मक विश्लेषणों ने डीप-डीएक्ससर्च की नैदानिक ​​नीति में सुधारों को उजागर किया, इसके प्रदर्शन लाभों की गहन अंतर्दृष्टि प्रदान की और चिकित्सकों को अधिक विश्वसनीय और सटीक प्रारंभिक निदान प्रदान करने में मदद की।

Takeaways, Limitations

Takeaways:
हमने एंड-टू-एंड सुदृढीकरण सीखने पर आधारित एजेंट आरएजी प्रणाली के माध्यम से चिकित्सा निदान की सटीकता में काफी सुधार किया है।
इसने ऐसा प्रदर्शन दिखाया जो मौजूदा अत्याधुनिक मॉडलों जैसे GPT-4o और DeepSeek-R1 से भी बेहतर था।
इसने वितरण के अंतर्गत और वितरण से बाहर दोनों ही स्थितियों में उत्कृष्ट प्रदर्शन किया है तथा सामान्य और दुर्लभ दोनों प्रकार की बीमारियों के निदान में प्रभावी साबित हुआ है।
हमने पुरस्कार डिजाइन और पुनर्प्राप्ति कोष के महत्व की पहचान की, तथा भविष्य के अनुसंधान की दिशाएं सुझाईं।
केस अध्ययन और व्याख्यात्मक विश्लेषण आपको मॉडल की निर्णय लेने की प्रक्रिया को समझने में मदद करते हैं।
Limitations:
वर्तमान में उपलब्ध जानकारी डीप-डीएक्ससर्च के प्रशिक्षण डेटा आकार, प्रशिक्षण समय और कम्प्यूटेशनल संसाधन खपत के बारे में विशिष्ट जानकारी प्रदान नहीं करती है।
वास्तविक नैदानिक ​​वातावरण में अतिरिक्त प्रदर्शन मूल्यांकन और सत्यापन की आवश्यकता है।
मॉडल की मतिभ्रम समस्या का समाधान हो सकता है तथा इसमें और सुधार की गुंजाइश हो सकती है।
बड़े पैमाने पर चिकित्सा डेटा से संबंधित पहुंच और गोपनीयता के मुद्दों पर विचार किया जाना चाहिए।
👍