दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

डेटासेट चयन के साथ एंड-टू-एंड टेक्स्ट-टू-SQL: अनुकूली क्वेरी निर्माण के लिए LLM का लाभ उठाना

फूरियर-वीएलएम: बड़े विज़न-लैंग्वेज मॉडल के लिए फ़्रीक्वेंसी डोमेन में विज़न टोकन को संपीड़ित करना

LAG: कार्टेशियन परिप्रेक्ष्य से तर्क-संवर्धित पीढ़ी

इको: विषम झुंडों पर बड़े पैमाने पर आरएल संरेखण के लिए वियुग्मन अनुमान और प्रशिक्षण

एफडीसी-नेट: ईईजी आर्टिफैक्ट निष्कासन और बहुआयामी भावात्मक कंप्यूटिंग के बीच संबंध पर पुनर्विचार

डिसार्थ्रिक स्पीच सिंथेसिस में निष्पक्षता: F5-TTS का उपयोग करके डिसार्थ्रिक स्पीच क्लोनिंग में आंतरिक पूर्वाग्रह को समझना

आरसीआर-राउटर: संरचित मेमोरी वाले मल्टी-एजेंट एलएलएम सिस्टम के लिए कुशल भूमिका-जागरूक संदर्भ रूटिंग

DS$^2$Net: मेडिकल इमेज सेगमेंटेशन के लिए डिटेल-सिमेंटिक डीप सुपरविज़न नेटवर्क

LLMDistill4Ads: eBay पर विज्ञापनदाता कीवर्ड अनुशंसाओं के लिए LLM सिग्नल से निष्कर्ष निकालने हेतु क्रॉस-एनकोडर्स का उपयोग करना

जब कारों में रूढ़ियाँ होती हैं: टेक्स्ट-टू-इमेज मॉडल से वस्तुओं में जनसांख्यिकीय पूर्वाग्रह का ऑडिट करना

हाईटेक: सिमेंटिक-अवेयर ऑग्मेंटेशन के साथ टेक्स्ट-एट्रिब्यूटेड हाइपरग्राफ पर पदानुक्रमित कंट्रास्टिव लर्निंग

स्पेक्ट्रमएफएम: फाउंडेशन मॉडलिंग के माध्यम से स्पेक्ट्रम संज्ञान को पुनर्परिभाषित करना

पदानुक्रमित वर्ग-वृद्धिशील अर्थपूर्ण विभाजन के साथ गतिशील रोबोट-सहायता प्राप्त सर्जरी

संभावित पंजीकरणों से नैदानिक परीक्षणों में गंभीर प्रतिकूल घटना परिणामों की भविष्यवाणी करने के लिए एक नवीन भाषा मॉडल

थोड़ी सी आज़ादी बहुत काम आती है: जनरेटिव मॉडल के तहत सुदृढीकरण सीखने के लिए शास्त्रीय और क्वांटम एल्गोरिदम

ALLoyM: मिश्र धातु चरण आरेख भविष्यवाणी के लिए एक बड़ा भाषा मॉडल

वाक्-संचालित 3D चेहरे के एनीमेशन को बेहतर बनाने के लिए ध्वन्यात्मक संदर्भ-निर्भर विसेम सीखना

क्या विज़न फाउंडेशन मॉडल आउट-ऑफ-द-बॉक्स मेडिकल इमेज पंजीकरण के लिए तैयार हैं?

सिस्टोलिक अटेंशन: एकल सिस्टोलिक ऐरे के भीतर फ्लैश अटेंशन का संयोजन

RAPNet: पैनशार्पनिंग के लिए एक ग्रहणशील-क्षेत्र अनुकूली कन्वोल्यूशनल न्यूरल नेटवर्क

एमिक्स-1: परीक्षण-समय स्केलेबल प्रोटीन फाउंडेशन मॉडल का मार्ग

पूर्वानुमान के अंतिम पड़ाव को पाटना: सशर्त निर्देशित प्रवाह मिलान के साथ समय श्रृंखला पूर्वानुमान को बढ़ाना

Speckle2Self: बिना किसी स्पष्ट डेटा के स्व-पर्यवेक्षित अल्ट्रासाउंड स्पेक रिडक्शन

LIRA: स्थानीय इंटरलीव्ड क्षेत्र सहायता के साथ बड़े बहु-मॉडल मॉडल में विभाजन का अनुमान लगाना

उदाहरण-मुक्त सतत शिक्षण में एकल-कार्य डेटा विषाक्तता के विनाशकारी प्रभावों को संबोधित करना

आधार बनाम डोमेन-विशिष्ट मॉडल: चेहरा पहचान में प्रदर्शन तुलना, संलयन और व्याख्यात्मकता

अनुमान-समय स्केलिंग के लिए संभाव्य इष्टतमता

ARAG: व्यक्तिगत अनुशंसा के लिए एजेंटिक पुनर्प्राप्ति संवर्धित पीढ़ी

कम संसाधन वाले संगीत निर्माण के लिए एडाप्टर डिज़ाइन ट्रेडऑफ़ की खोज

साइकिल डिस्टिल: चक्रीय आसवन के साथ एलएलएम का उपयोग करके मशीन अनुवाद को बूटस्ट्रैप करना

नेटवर्क ट्रैफ़िक में मज़बूत विसंगति का पता लगाना: CICIDS2017 पर मशीन लर्निंग मॉडल का मूल्यांकन

वैश्विक लिप्सचिट्ज़ नियमितीकरण के माध्यम से मजबूत व्यवहार क्लोनिंग

ग्रैन्युलर-बॉल-प्रेरित मल्टीपल कर्नेल K-मीन्स

ड्रामा-X: ड्राइविंग के लिए एक सूक्ष्म इरादे की भविष्यवाणी और जोखिम तर्क बेंचमार्क

एमएमईटी: कुशल पीडीई समाधान के लिए एक बहु-इनपुट और बहु-स्केल ट्रांसफार्मर

विस्तृत-सीमा एकल-इलेक्ट्रॉन क्वांटम चुंबकीय संवेदन के लिए दो-चरणीय अनुकूलन विधि

वैश्विक उप-मौसमी-से-मौसमी पूर्वानुमान के लिए भौतिकी-सूचित टेलीकनेक्शन-जागरूक ट्रांसफार्मर

गठबंधन निर्माण के लिए एआई-जनित समझौते

माइक्रोसर्विसेज के साथ एमएलओपीएस: समुद्री क्षेत्र पर एक केस स्टडी

बहुभिन्नरूपी संभाव्य समय श्रृंखला पूर्वानुमान के लिए विजेता-सभी-लेता है

दृश्य से परे छलांग: नैदानिक नोट्स के लिए सुदृढ़ तर्क संवर्धित पीढ़ी

निजी तौर पर निदान करना सीखना: रेडियोलॉजी रिपोर्ट वर्गीकरण के लिए डीपी-संचालित एलएलएम

HERGC: बहुविध ज्ञान ग्राफ़ के लिए विषम विशेषज्ञ प्रतिनिधित्व और जनरेटिव पूर्णता

वर्बल वेयरवोल्फ: वर्बलाइज्ड एजेंटिक वेयरवोल्फ गेम फ्रेमवर्क के साथ उपयोगकर्ताओं को जोड़ें

MaCP: पदानुक्रमित कोसाइन प्रक्षेपण के माध्यम से न्यूनतम लेकिन शक्तिशाली अनुकूलन

CADRE: गोपनीयता-संरक्षण संघीय शिक्षा में डेटा तत्परता का अनुकूलन योग्य आश्वासन

एफपी4 ऑल द वे: एलएलएम का पूर्णतः क्वांटाइज्ड प्रशिक्षण

विशेषज्ञ मॉडल एकीकरण के साथ जेलब्रेक हमलों के विरुद्ध LLM आउटपुट में सुधार

बेयसियन नेटवर्क पैरामीटरीकरण के लिए बड़े भाषा मॉडल से संभाव्य ज्ञान निकालना

रिजकट: रिंग्स और वेजेज के साथ ग्राफ विभाजन सीखना

एकसमान हानि बनाम विशिष्ट अनुकूलन: बहु-कार्य सीखने में एक तुलनात्मक विश्लेषण

क्या एलएलएम-आधारित वित्तीय निवेश रणनीतियाँ दीर्घकाल में बाज़ार से बेहतर प्रदर्शन कर सकती हैं?

डिफ्यूजन एमआरआई ट्रैक्टोग्राफी में श्वेत पदार्थ के आकार की भविष्यवाणी के लिए एक बहुविध गहन शिक्षण दृष्टिकोण

स्पार्सिटी ने कम-शॉट अनुकूलन में निम्न-रैंक अनुमानों को पीछे छोड़ दिया

द्विदिशात्मक पदानुक्रमित प्रोटीन बहु-मोडल प्रतिनिधित्व सीखना

प्रशिक्षण के बाद एलएलएम को कैसे नया रूप दिया जाता है: ज्ञान, सत्यता, इनकार और आत्मविश्वास पर एक यंत्रवत दृष्टिकोण

$\Mu$KE: बड़े भाषा मॉडल का मातृयोश्का असंरचित ज्ञान संपादन

RGB वीडियो से 3D-गॉसियन सिमुलेटर सीखना

एकल प्रदर्शनों से अनुकूली निपुणतापूर्ण पकड़ सीखना

स्वप्रतिगामी विचार श्रृंखला के साथ सीखने का एक सिद्धांत

फ़नग्राफ़: भाषा-प्रेरित दृश्य इंटरैक्शन के लिए कार्यात्मकता-सचेत 3D दृश्य ग्राफ़

पुनः उपयोग से पूर्वानुमान तक: टेलरसीर्स के साथ प्रसार मॉडल में तेजी लाना

एलिमेंट्रीनेट: सामान्य-रूप वाले खेलों में मानव व्यवहार की भविष्यवाणी करने के लिए एक गैर-रणनीतिक तंत्रिका नेटवर्क

एलएलएम के बीच सामूहिक तर्क: बिना किसी ठोस आधार के उत्तर सत्यापन हेतु एक रूपरेखा

एआई-संचालित चिकित्सा छवि संश्लेषण को आगे बढ़ाना: CLIP, फाइन-ट्यून्ड स्टेबल डिफ्यूजन और ड्रीम-बूथ + LoRA का उपयोग करते हुए MedVQA-GI चुनौती से अंतर्दृष्टि

इंटरैक्टिव बहु-विषय सहयोग से स्क्रीनिंग साक्षात्कारों में अवसाद की भविष्यवाणी करना

मल्टी-एजेंट लार्ज लैंग्वेज मॉडल सिस्टम पर आधारित स्कीमा-निर्देशित दृश्य-ग्राफ़ तर्क

एमक्वांट: पूर्ण स्थैतिक क्वांटीकरण के माध्यम से बहुविधीय वृहद भाषा मॉडलों की अनुमान क्षमता को उन्मुक्त करना

स्केलेबल डीप कूपमैन प्रेडिक्टिव कंट्रोल के साथ मिश्रित यातायात प्रवाह में यातायात दोलनों को कम करना

वोट रिगिंग द्वारा चैटबॉट क्षेत्र में अपने मॉडल की रैंकिंग में सुधार करें

फिट-प्रिंट: लक्षित फिंगरप्रिंट के माध्यम से झूठे दावों से बचाव हेतु मॉडल स्वामित्व सत्यापन की दिशा में

पुनःभारन के साथ सॉफ्टप्लस अटेंशन बड़े भाषा मॉडल में लंबाई एक्सट्रपलेशन को बढ़ाता है

एरेनफुच्ट-हौस्लर रैंक और विचार श्रृंखला

वेबवॉकर: वेब ट्रैवर्सल में एलएलएम की बेंचमार्किंग

सेल-एनीमेशन के लिए जनरेटिव एआई: एक सर्वेक्षण

बुद्धिमान और सुरक्षित क्लाउड की ओर: बड़े भाषा मॉडल से सशक्त सक्रिय रक्षा

अस्थायी रूप से मजबूत क्षण पुनर्प्राप्ति के लिए लंबाई-जागरूक DETR के साथ मोमेंटमिक्स संवर्द्धन

POEX: LLM-आधारित रोबोटों के विरुद्ध नीतिगत निष्पादन योग्य जेलब्रेक हमलों की ओर

बी-वीएलएलएम: संतुलित स्थानिक-कालिक टोकन के साथ एक विज़न लार्ज लैंग्वेज मॉडल

LoRA.rar: विषय-शैली वातानुकूलित छवि निर्माण के लिए हाइपरनेटवर्क के माध्यम से LoRAs को मर्ज करना सीखना

संभाव्यता परिदृश्यों की तीक्ष्णता के माध्यम से जनरेटिव मॉडल में स्मरणशक्ति को समझना और कम करना

सामान्य दर्शकों के लिए वैज्ञानिक पाठ के AI-संचालित वैयक्तिकरण का संचालन

कंटेंट-अवेयर टिम्बर एन्सेम्बल और कंडीशनल फ्लो मैचिंग के माध्यम से जीरो-शॉट वॉयस रूपांतरण

कुशलEQA: मुक्त-शब्दावली आधारित प्रश्नोत्तर के लिए एक कुशल दृष्टिकोण

यूओएमओ: वायरलेस नेटवर्क अनुकूलन के लिए मोबाइल ट्रैफ़िक पूर्वानुमान का एक सार्वभौमिक मॉडल

हवाई दृष्टि-भाषा नेविगेशन में एलएलएम तर्क को बढ़ाने के लिए स्थानिक प्रतिनिधित्व की खोज

बड़े भाषा मॉडल के लिए मशीन अनलर्निंग पर एक करीबी नज़र

कुशल अनुकूलन के लिए IoT-सक्षम कैमरा ट्रैप में वन्यजीव मॉडलों का इन-सीटू फाइन-ट्यूनिंग

अत्यधिक लेबल-कुशल नैदानिक फेनोटाइपिंग के लिए ईईजी-भाषा पूर्व-प्रशिक्षण

अतिरिक्त भाषा मिश्रण अनुपात के इष्टतम चयन के साथ लामा-3 70B पर प्रशिक्षण के बाद का अभ्यास

क्यू-लर्निंग के माध्यम से पुरस्कार-निर्देशित स्कोर-आधारित प्रसार मॉडल

विचार श्रृंखला अभी भी तेजी से सोचती है: APriCoT धीमी गति से सोचने में मदद करता है

मॉडल मोएर्जिंग पर एक सर्वेक्षण: सहयोगात्मक शिक्षण के लिए विशिष्ट विशेषज्ञों के बीच पुनर्चक्रण और रूटिंग

एआई-एआई पूर्वाग्रह: बड़े भाषा मॉडल बड़े भाषा मॉडल द्वारा उत्पन्न संचार का पक्ष लेते हैं

LVBench: एक अत्यंत लंबा वीडियो समझने वाला बेंचमार्क

स्पाइक्स से हेवी टेल्स तक: न्यूरल नेटवर्क के स्पेक्ट्रल विकास का अनावरण

खंडित कांच, विफल कैमरे: स्वायत्त ड्राइविंग प्रणालियों के लिए भौतिकी-आधारित प्रतिकूल नमूनों का अनुकरण

जनरेटिव एआई में रनटाइम मॉनिटरिंग और सशर्त निष्पक्षता का प्रवर्तन

सुदृढीकरण सीखने में अमूर्तता और क्षमता-आधारित पुरस्कार आकार देने की नमूना दक्षता पर

आरएलटीएचएफ: एलएलएम संरेखण के लिए लक्षित मानव प्रतिक्रिया

Created by

Haebom

लेखक

यिफ़ेई जू, तुशेर चक्रवर्ती, एम्रे के मैन, बिबेक आर्यल, एडुआर्डो रोड्रिग्स, श्रीनागेश शर्मा, रॉबर्टो एस्टेवाओ, मारिया एंजल्स डी लुइस बालगुएर, जेसिका वॉक, राफेल पाडिल्हा, लियोनार्डो नून्स, शोबाना बालाकृष्णन, सोंगवु लू, रणवीर चंद्रा

रूपरेखा

यह शोधपत्र मानव-प्रतिक्रिया-आधारित सुदृढीकरण अधिगम (RLHF) की उच्च लागत और बड़े पैमाने के भाषा मॉडल (LLM) को उपयोगकर्ता की प्राथमिकताओं के अनुरूप बनाने की प्रक्रिया में AI प्रतिक्रिया के सीमित सामान्यीकरण को संबोधित करने के लिए, RLTHF, एक मानव-AI हाइब्रिड ढाँचा प्रस्तावित करता है। RLTHF, LLM-आधारित प्रारंभिक संरेखण को चुनिंदा मानव टिप्पणियों के साथ जोड़कर, न्यूनतम प्रयास से पूर्ण मानव-टिप्पणी संरेखण प्राप्त करता है। यह LLM द्वारा गलत वर्गीकृत किए गए चुनौतीपूर्ण नमूनों की पहचान करने के लिए पुरस्कार मॉडल के पुरस्कार वितरण का उपयोग करता है और रणनीतिक मानव सुधारों को शामिल करते हुए LLM द्वारा सही ढंग से वर्गीकृत नमूनों का लाभ उठाकर संरेखण में सुधार करता है। HH-RLHF और TL;DR डेटासेट पर मूल्यांकन परिणाम दर्शाते हैं कि RLTHF केवल 6-7% मानव-टिप्पणी कार्यों के साथ पूर्ण मानव-टिप्पणी संरेखण प्राप्त करता है। इसके अलावा, RLTHF के क्यूरेटेड डेटासेट पर प्रशिक्षित मॉडल, उप-कार्यों पर पूर्ण मानव-टिप्पणी डेटासेट पर प्रशिक्षित मॉडलों से बेहतर प्रदर्शन करते हैं, जो RLTHF की प्रभावशीलता को उजागर करता है।

Takeaways, Limitations

•

Takeaways:

◦

आरएलएचएफ की उच्च लागत को प्रभावी ढंग से संबोधित करने के लिए एक नया दृष्टिकोण प्रस्तुत किया गया है।

◦

न्यूनतम मानवीय प्रयास से उच्च स्तरीय मॉडल संरेखण प्राप्त करना।

◦

आरएलटीएचएफ से प्रशिक्षित मॉडल, मौजूदा पूर्णतः एनोटेट डेटा पर आधारित मॉडल से बेहतर प्रदर्शन करते हैं।

◦

एक संकर दृष्टिकोण की प्रभावशीलता का प्रदर्शन करना जो एलएलएम की शक्तियों को मानव विशेषज्ञता के साथ प्रभावी ढंग से जोड़ता है।

•

Limitations:

◦

आरएलटीएचएफ का प्रदर्शन पुरस्कार मॉडल की सटीकता पर निर्भर हो सकता है। पुरस्कार मॉडल के प्रदर्शन में कमी से आरएलटीएचएफ की दक्षता में कमी आ सकती है।

◦

चूंकि मूल्यांकन परिणाम सीमित डेटासेट (HH-RLHF, TL;DR) से हैं, इसलिए अन्य डेटासेट या कार्यों के लिए सामान्यीकरण प्रदर्शन निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।

◦

इस बात का विस्तृत विश्लेषण नहीं है कि एलएलएम द्वारा किस प्रकार की त्रुटियां की जाती हैं और कौन सी त्रुटियों को मनुष्यों द्वारा सुधारा जाता है।

◦

आरएलटीएचएफ की चयनात्मक मानव एनोटेशन रणनीति को अनुकूलित करने के लिए आगे अनुसंधान की आवश्यकता है।

पीडीएफ देखें

Made with Slashpage