यह शोधपत्र जैवध्वनिक पहचान और वर्गीकरण कार्यों के लिए वाक्-आधारित स्व-पर्यवेक्षित शिक्षण मॉडलों (HuBERT, WavLM, और XEUS) के स्थानांतरण अधिगम प्रदर्शन का अध्ययन करता है। हम विविध वर्गकों से पशु ध्वनियों के समृद्ध अव्यक्त निरूपण उत्पन्न करने की उनकी क्षमता प्रदर्शित करते हैं, और समय-औसत निरूपणों की रैखिक जाँच के माध्यम से मॉडल विशेषताओं का विश्लेषण करते हैं। इसके अलावा, हम विभिन्न अनुप्रवाह आर्किटेक्चर का उपयोग करके लौकिक सूचना के प्रभाव पर विचार करने के लिए दृष्टिकोण का विस्तार करते हैं, और प्रदर्शन पर आवृत्ति परास और शोर के प्रभाव का अध्ययन करते हैं। परिणामस्वरूप, हम परिष्कृत जैवध्वनिक पूर्व-प्रशिक्षण मॉडलों के साथ प्रतिस्पर्धी प्रदर्शन प्रदर्शित करते हैं, और शोर-सहिष्णु पूर्व-प्रशिक्षण सेटिंग्स के प्रभाव को प्रदर्शित करते हैं। यह जैवध्वनिक अनुसंधान को आगे बढ़ाने के लिए एक प्रभावी ढाँचे के रूप में वाक्-आधारित स्व-पर्यवेक्षित शिक्षण की क्षमता को उजागर करता है।