Bài báo này đề cập đến các vấn đề về khả năng tái tạo và chất lượng của chuẩn mực Ước lượng Tư thế dựa trên Lý luận (RPE). Chuẩn mực RPE được sử dụng rộng rãi làm tiêu chuẩn để đánh giá các mô hình ngôn ngữ quy mô lớn đa phương thức (MLLM) nhận biết tư thế. Tuy nhiên, chúng tôi chỉ ra rằng nó đòi hỏi một quy trình so khớp thủ công để có được các chú thích GT chính xác bằng cách sử dụng các chỉ số hình ảnh khác với tập dữ liệu 3DPW gốc. Chúng tôi cũng phân tích các hạn chế về chất lượng chuẩn mực, chẳng hạn như chồng chéo hình ảnh, mất cân bằng kịch bản, tư thế đơn giản và mô tả văn bản mơ hồ. Để giải quyết những vấn đề này, chúng tôi cải thiện các chú thích GT và mã nguồn mở để tạo điều kiện cho việc đánh giá định lượng nhất quán và phát triển MLLM.