प्रोटीन भाषा मॉडल अभ्यावेदन का उपयोग करने वाला एक सुप्त विसरण ढाँचा, DiMA, एक सशक्त कार्यप्रणाली प्रस्तुत करता है जो विभिन्न प्रोटीन एनकोडर्स (8M से 3B पैरामीटर) में सामान्यीकरण करता है। मौजूदा स्वप्रतिगामी, असतत विसरण और प्रवाह-संगत भाषा मॉडलों की तुलना में, यह बहु-प्रोटीन अभ्यावेदन (ESM-2, ESMc, CHEAP, SaProt) और विभिन्न मूल्यांकन मानकों (गुणवत्ता, विविधता, नवीनता और वितरण अनुरूपता) का उपयोग करते हुए व्यापक प्रयोगों में लगातार अच्छा प्रदर्शन करता है, जिससे नवीन, उच्च-गुणवत्ता वाले और विविध प्रोटीन अनुक्रम उत्पन्न होते हैं। यह सशर्त जनरेटिव कार्यों, जैसे प्रोटीन परिवार निर्माण, मोटिफ स्कैफोल्डिंग और फिलिंग, और फोल्ड-विशिष्ट अनुक्रम डिज़ाइन, का भी समर्थन करता है।