Bài báo này đề xuất CAD2DMD-SET, một công cụ tạo dữ liệu tổng hợp, để giải quyết thách thức thực tế của các mô hình ngôn ngữ thị giác quy mô lớn (LVLM) đang gặp khó khăn với nhiệm vụ đơn giản là đọc giá trị từ các thiết bị đo lường kỹ thuật số (DMD). CAD2DMD-SET tận dụng các mô hình CAD 3D, kết xuất nâng cao và tổng hợp hình ảnh độ trung thực cao để tạo ra một tập dữ liệu DMD tổng hợp được gắn nhãn VQA đa dạng, cùng với một bộ xác thực, DMDBench, để đánh giá các ràng buộc trong thế giới thực. Các đánh giá trên ba LVLM tiên tiến cho thấy những cải tiến đáng kể về hiệu suất đối với các mô hình được đào tạo bằng CAD2DMD-SET, với InternVL đạt được mức tăng hiệu suất 200%. CAD2DMD-SET sẽ được mã nguồn mở trong tương lai.