Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Xây dựng đồ thị chuẩn bằng các mô hình ngôn ngữ lớn để suy luận theo hướng mạch lạc

Created by
  • Haebom

Tác giả

Steve Huntsman, Jewell Thomas

Phác thảo

Bài báo này trình bày một thuật toán để tạo ra các mệnh đề biểu diễn khách quan các đồ thị hỗ trợ suy luận dựa trên tính nhất quán. Hơn nữa, chúng tôi đánh giá khả năng của các mô hình ngôn ngữ quy mô lớn (LLM) trong việc tái tạo đồ thị nhất quán từ các mệnh đề được diễn đạt bằng ngôn ngữ tự nhiên (được chuyển đổi đơn giản). Chúng tôi chứng minh kết quả đầy hứa hẹn bằng cách sử dụng một lời nhắc duy nhất trên LLM được tối ưu hóa cho suy luận. Ví dụ, o1/3/4-mini đạt được khả năng tái tạo hoàn hảo trong một nửa thời gian đối với đồ thị thưa thớt. Suy luận dựa trên tính nhất quán để đánh giá tính nhất quán của LLM có thể nâng cao khả năng nhận thức của máy.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một thuật toán mới để tạo đồ thị hỗ trợ suy luận dựa trên tính nhất quán.
Kết quả đầy hứa hẹn chứng minh tiềm năng của việc tái tạo đồ thị nhất quán bằng LLM
Đề Xuất khả năng cải thiện khả năng nhận thức của máy móc thông qua đánh giá tính nhất quán của LLM.
Limitations:
ĐáNh giá hiệu suất của thuật toán đề xuất và LLM bị giới hạn ở đồ thị thưa thớt.
Cần có thêm nghiên cứu về khả năng khái quát hóa cho các loại biểu đồ và đề xuất khác nhau.
Những hạn chế tiềm ẩn trong hiệu suất LLM do sử dụng một lời nhắc duy nhất
Cần có một phân tích sâu hơn về đánh giá tính nhất quán của LLM.
👍