[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Khảo sát về các lĩnh vực trong lý luận LLM: Quy mô suy luận, Học cách lý luận và Hệ thống tác nhân

Created by
  • Haebom

Tác giả

Zixuan Ke, Fangkai Jiao, Yifei Ming, Xuân-Phi Nguyễn, Austin Xu, Đỗ Xuân Long, Minzhi Li, Chengwei Qin, Peifeng Wang, Silvio Savarese, Caiming Xiong, Shafiq Joty

Phác thảo

Bài báo này là một bài khảo sát tập trung vào khả năng suy luận của các mô hình ngôn ngữ quy mô lớn (LLM). Khả năng suy luận của LLM là một đặc điểm quan trọng giúp phân biệt các hệ thống AI tiên tiến với các mô hình hiện có. Trong bài báo này, chúng tôi phân loại các phương pháp suy luận hiện có thành hai chiều: "Chế độ" xác định thời điểm diễn ra suy luận (thời gian suy luận hoặc suy luận thông qua đào tạo) và "Kiến trúc" xác định các thành phần tham gia vào quá trình suy luận (LLM độc lập, hệ thống tác nhân-tổng hợp tích hợp các công cụ bên ngoài, cộng tác đa tác nhân). Trong mỗi chiều, chúng tôi phân tích hai góc nhìn: "Mức đầu vào" tập trung vào các kỹ thuật tạo lời nhắc chất lượng cao và "Mức đầu ra" cải thiện chất lượng suy luận bằng cách cải thiện nhiều mẫu ứng viên. Bài báo nêu bật các xu hướng mới nổi như sự chuyển dịch từ quy mô suy luận sang suy luận dựa trên học tập (ví dụ: DeepSeek-R1), sang quy trình làm việc dựa trên tác nhân (ví dụ: OpenAI Deep Research, Manus Agent) và đề cập đến nhiều thuật toán học tập từ tinh chỉnh học tập có giám sát đến học tăng cường (PPO, GRPO) và đào tạo bộ suy luận và bộ xác minh, cũng như các thiết kế chính của quy trình làm việc dựa trên tác nhân như thảo luận về bộ tạo-đánh giá và LLM.

Takeaways, Limitations

Takeaways:
Phân loại một cách có hệ thống các phương pháp suy luận LLM để hiểu sâu hơn về lĩnh vực suy luận LLM đang phát triển.
Chúng tôi trình bày các xu hướng chính như sự chuyển dịch từ mở rộng suy luận sang suy luận dựa trên học tập và sự chuyển dịch sang quy trình làm việc dựa trên tác nhân.
Bao gồm toàn diện nhiều thuật toán học tập và thiết kế quy trình làm việc dựa trên tác nhân.
Limitations:
Vì bài báo này là một bài báo khảo sát nên không trình bày bất kỳ phương pháp luận hoặc kết quả thử nghiệm mới nào.
Khối lượng lớn các phương pháp được đề cập có thể ngăn cản việc phân tích sâu từng phương pháp.
Do sự phát triển nhanh chóng trong lĩnh vực suy luận LLM, nhiều phương pháp luận mới có thể sẽ xuất hiện sau khi bài báo được công bố.
👍