DiMA, một khuôn khổ khuếch tán tiềm ẩn sử dụng biểu diễn mô hình ngôn ngữ protein, trình bày một phương pháp luận mạnh mẽ, có thể khái quát hóa trên nhiều bộ mã hóa protein (tham số từ 8M đến 3B). So với các mô hình ngôn ngữ tự hồi quy, khuếch tán rời rạc và nhất quán dòng chảy hiện có, DiMA luôn hoạt động tốt trong các thí nghiệm mở rộng sử dụng nhiều biểu diễn protein (ESM-2, ESMc, CHEAP, SaProt) và nhiều chỉ số đánh giá khác nhau (chất lượng, tính đa dạng, tính mới lạ và tính đồng nhất phân phối), tạo ra các trình tự protein mới, chất lượng cao và đa dạng. DiMA cũng hỗ trợ các tác vụ sinh sản có điều kiện, chẳng hạn như tạo họ protein, tạo khung và lấp đầy motif, và thiết kế trình tự đặc hiệu theo nếp gấp.