[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

वार्तालाप वन: बहु-मोड़ चिकित्सा वार्तालापों के लिए बड़े भाषा मॉडल को ठीक करने की कुंजी शाखाबद्धता है

Created by
  • Haebom

लेखक

थॉमस सैवेज

रूपरेखा

इस पत्र में, हम सैवेज कन्वर्सेशन फ़ॉरेस्ट (SCF) का प्रस्ताव रखते हैं, जो बहु-चक्रीय वार्तालाप कार्यों पर बड़े पैमाने के भाषा मॉडल (LLM) को परिष्कृत करने के लिए एक सुदृढीकरण अधिगम ढाँचा है। DPO और GRPO जैसी मौजूदा विधियाँ एकल-चक्रीय कार्यों के लिए प्रभावी हैं, लेकिन वे चिकित्सा निदान साक्षात्कार जैसे बहु-चक्रीय कार्यों के लिए उपयुक्त नहीं हैं, जहाँ प्रारंभिक वार्तालाप चक्र परिणामों को प्रभावित करते हैं। SCF प्रत्येक चक्र के लिए कई संभावित वार्तालाप निरंतरताएँ उत्पन्न करता है, जिससे मॉडल को यह समझने में मदद मिलती है कि प्रारंभिक प्रतिक्रियाएँ बाद की अंतःक्रियाओं और निदान परिणामों को कैसे प्रभावित करती हैं। डॉक्टर-रोगी वार्तालापों पर सिमुलेशन प्रयोगों में, SCF रैखिक वार्तालाप संरचनाओं की तुलना में उच्च नैदानिक सटीकता प्राप्त करता है, जो दर्शाता है कि शाखित प्रशिक्षण संरचना जटिल बहु-चक्रीय वार्तालाप कार्यों पर LLM को परिष्कृत करने के लिए एक महत्वपूर्ण रणनीति है।

Takeaways, Limitations

Takeaways:
बहु-चक्रीय वार्तालाप कार्यों में एलएलएम के प्रदर्शन को बेहतर बनाने के लिए एक नवीन सुदृढीकरण शिक्षण ढांचा एससीएफ प्रस्तुत किया गया है।
शाखाबद्ध वार्तालाप संरचना के माध्यम से प्रारंभिक वार्तालाप दौर के प्रभाव पर विचार करके अधिक सटीक नैदानिक परिणाम प्राप्त करने की संभावना का सुझाव देना
चिकित्सा क्षेत्र सहित विभिन्न जटिल बहु-दौर वार्तालाप कार्यों के लिए प्रयोज्यता का सुझाव देता है
यह जानने का एक प्रभावी तरीका प्रदान करता है कि प्रारंभिक प्रतिक्रियाएं बाद की बातचीत को कैसे प्रभावित करती हैं
Limitations:
वर्तमान में प्रस्तुत प्रायोगिक परिणाम डॉक्टर-रोगी वार्तालाप के अनुकरण तक सीमित हैं। वास्तविक चिकित्सा वातावरण में सत्यापन आवश्यक है।
यह स्पष्ट नहीं है कि एससीएफ के प्रदर्शन में सुधार शाखित संरचना के कारण है या अन्य कारकों के कारण। अतिरिक्त विश्लेषण की आवश्यकता है।
अन्य बहु-सत्र वार्तालाप कार्यों के लिए सामान्यीकरण पर अतिरिक्त शोध की आवश्यकता है।
👍