Trong bài báo này, chúng tôi đề xuất một quy trình chuyển đổi phản hồi thực tế của người dùng thành một danh sách kiểm tra có cấu trúc một cách có hệ thống nhằm giải quyết vấn đề các số liệu tự động hiện có để đánh giá chất lượng hồ sơ bệnh án do AI tạo ra không khớp với sở thích thực tế của bác sĩ. Sử dụng hơn 21.000 hồ sơ bệnh án được lập theo các điều khoản bảo mật HIPAA, chúng tôi chứng minh rằng danh sách kiểm tra dựa trên phản hồi được đề xuất vượt trội hơn các phương pháp hiện có về phạm vi bao phủ, tính đa dạng và khả năng dự đoán của đánh giá của con người. Kết quả thực nghiệm cho thấy danh sách kiểm tra này có khả năng chống lại các yếu tố làm giảm chất lượng, có tính nhất quán cao với sở thích của bác sĩ lâm sàng và có giá trị thực tế như một phương pháp đánh giá. Trong bối cảnh nghiên cứu ngoại tuyến, danh sách kiểm tra này có thể giúp xác định các hồ sơ không đạt tiêu chuẩn chất lượng đã được thiết lập.