Để Giải quyết những thách thức của việc đánh giá đầu ra mở của các mô hình đa phương thức quy mô lớn, bài báo này đề xuất UFEval, một bộ đánh giá chi tiết tích hợp nhiều tác vụ và khía cạnh. UFEval dựa trên phân loại khía cạnh phân cấp bao gồm 112 khía cạnh chi tiết trên bốn tác vụ: tạo ngôn ngữ tự nhiên, hiểu hình ảnh, tạo hình ảnh, và tạo văn bản chéo và hình ảnh. Chúng tôi đã huấn luyện UFEval trên FRABench, một bộ dữ liệu đánh giá chi tiết bao gồm 64.000 mẫu so sánh từng cặp và 325.000 nhãn đánh giá. Kết quả thực nghiệm chứng minh rằng việc học trên các khía cạnh cụ thể cho phép khái quát hóa các khía cạnh chưa được biết đến, và việc học kết hợp trên nhiều tác vụ và khía cạnh mang lại kết quả có lợi cho cả hai bên.