Bài báo này phân tích mức tiêu thụ năng lượng của bảy mô hình tạo văn bản thành âm thanh dựa trên phương pháp khuếch tán tiên tiến, có khả năng chuyển đổi văn bản thành âm thanh. Chúng tôi đánh giá tác động của việc thay đổi các tham số tạo trong quá trình suy luận lên mức tiêu thụ năng lượng, và đặt mục tiêu tìm ra sự cân bằng tối ưu giữa chất lượng âm thanh và mức tiêu thụ năng lượng bằng cách xem xét các giải pháp tối ưu Pareto trong tất cả các mô hình được chọn. Điều này cung cấp cái nhìn sâu sắc về sự đánh đổi giữa hiệu suất và tác động môi trường, góp phần phát triển các mô hình âm thanh tạo hiệu quả hơn.