Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

TrustGeoGen: Công cụ dữ liệu được xác minh chính thức để giải quyết vấn đề hình học đa phương thức đáng tin cậy

Created by
  • Haebom

Tác giả

Dao Thành Fu, Jianlong Chen, Renqiu Xia, Zijun Chen, Qi Liu, Yuan Feng, Hongbin Chu, Renrui Zhang, Shiyang Feng, Peng Gao, Hongyuan Zha, Junchi Yan, Botian Shi, Yu Qiao, Bo Zhang

Phác thảo

Bài báo này trình bày TrustGeoGen, một công cụ dữ liệu tạo ra các bài toán hình học đã được xác thực chính thức để xây dựng một chuẩn mực đáng tin cậy cho việc giải quyết các bài toán hình học toán học (GPS). TrustGeoGen tích hợp bốn cải tiến cốt lõi—căn chỉnh đa phương thức, xác minh chính thức, tư duy kết nối và chuỗi thuật toán GeoExplore—để tạo ra nhiều biến thể bài toán với các giải pháp đa dạng và khả năng theo dõi tự phản ánh. Sử dụng công cụ này, chúng tôi đã tạo ra tập dữ liệu GeoTrust-200K và chuẩn mực GeoTrust-test, đảm bảo tính toàn vẹn xuyên phương thức. Kết quả thử nghiệm chứng minh độ khó của chuẩn mực này, với mô hình tiên tiến chỉ đạt độ chính xác 45,83% trên chuẩn mực GeoTrust-test. Hơn nữa, việc huấn luyện với dữ liệu tổng hợp cải thiện đáng kể hiệu suất mô hình trên các tác vụ GPS và tăng cường khả năng khái quát hóa thành các chuẩn mực ngoài miền (OOD). Mã và dữ liệu có sẵn tại https://github.com/Alpha-Innovator/TrustGeoGen .

Takeaways, Limitations

Takeaways:
ĐóNg góp vào sự phát triển của nghiên cứu trong lĩnh vực giải quyết vấn đề hình học (GPS) bằng cách cung cấp các tập dữ liệu vấn đề hình học được xác minh chính thức, chuẩn mực GeoTrust-200K và GeoTrust-test.
Chúng tôi chứng minh rằng việc đào tạo sử dụng dữ liệu tổng hợp được tạo thông qua công cụ TrustGeoGen có hiệu quả trong việc cải thiện hiệu suất mô hình cho các tác vụ GPS và nâng cao hiệu suất khái quát hóa đa miền.
Giải quyết vấn đề ảo giác của LLM Limitations hiện tại và đề xuất khả năng xây dựng bộ dữ liệu GPS đáng tin cậy.
Limitations:
Cần phải mở rộng hơn nữa quy mô của bộ dữ liệu GeoTrust-200K trong tương lai.
Cần phải xác thực thêm để đảm bảo rằng khả năng tạo ra dữ liệu của công cụ TrustGeoGen có thể xử lý đầy đủ mọi loại vấn đề hình học.
Các tiêu chuẩn hiện tại cho thấy các mô hình tiên tiến có hiệu suất dưới 50%, điều này cho thấy vẫn còn nhiều thách thức cần vượt qua.
👍