Bài báo này trình bày mô hình Chart-R1, áp dụng phương pháp kiểu R1 dựa trên tinh chỉnh học tăng cường cho suy luận phức tạp trong miền biểu đồ. Không giống như các phương pháp kiểu R1 hiện có tập trung vào lập luận toán học và trí tuệ mã hóa, Chart-R1 nâng cao khả năng suy luận cho dữ liệu đa phương thức tổng quát hơn, đặc biệt là dữ liệu biểu đồ. Để đạt được điều này, chúng tôi đề xuất một kỹ thuật tổng hợp dữ liệu theo chương trình mới tạo ra dữ liệu suy luận biểu đồ từng bước chất lượng cao chứa một và nhiều biểu đồ con. Chúng tôi cũng phát triển một chiến lược học hai bước: Chart-COT, sử dụng bản đồ Chuỗi suy nghĩ (COT), và Chart-RFT, sử dụng tinh chỉnh độ nhạy số. Chart-COT phân tích các tác vụ suy luận phức tạp thành các tác vụ con chi tiết, trong khi Chart-RFT nhấn mạnh độ nhạy số trong miền biểu đồ bằng cách sử dụng phần thưởng tương đối nhẹ nhàng cho các phản hồi số. Kết quả thử nghiệm cho thấy Chart-R1 vượt trội hơn các phương pháp miền biểu đồ hiện có và tương đương với các mô hình quy mô lớn như GPT-4o và Claude-3.5.