यह शोधपत्र वाक्-भावना पहचान के लिए एक बहुविध ढाँचा प्रस्तावित करता है। यह एक Wav2vec2.0-आधारित ध्वनिक मॉडल और एक RoBERTa-XLM-आधारित भाव विश्लेषण मॉडल (व्हिसपर-लार्ज-v3 से प्रतिलेखों का उपयोग करके) को एकीकृत करता है, और एन्ट्रॉपी-आधारित स्कोर चयन के माध्यम से वाक् और पाठ पूर्वानुमान परिणामों को संयोजित करता है। मुख्य पाइपलाइन पूर्वानुमान की विश्वसनीयता संबंधी बाधाओं को दूर करने के लिए, हम एन्ट्रॉपी और वेरेंट्रॉपी थ्रेसहोल्ड पर आधारित एक लेट स्कोर फ्यूजन विधि प्रस्तावित करते हैं। एक भाव मानचित्रण रणनीति जो तीन भाव श्रेणियों को चार लक्षित भाव वर्गों में परिवर्तित करती है, बहुविध पूर्वानुमानों के सुसंगत एकीकरण को सक्षम बनाती है। IEMOCAP और MSP-IMPROV डेटासेट पर प्राप्त परिणाम दर्शाते हैं कि प्रस्तावित विधि मौजूदा एकल-विध प्रणालियों की तुलना में व्यावहारिक और विश्वसनीय सुधार प्रदान करती है।