Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
Những bước đầu tiên để nghe lén các đặc vụ LLM: Một nghiên cứu điển hình với lối chơi Dungeons & Dragons
Created by
Haebom
Tác giả
Andrew Zhu, Evan Osgood, Chris Callison-Burch
Phác thảo
Bài báo này trình bày "tác nhân nghe lén", một mô hình mới khác với các tác nhân LLM đàm thoại hiện có. Tác nhân nghe lén không trực tiếp tham gia vào các cuộc trò chuyện; thay vào đó, chúng "nghe lén" các cuộc trò chuyện của con người và thực hiện các tác vụ nền hoặc đưa ra gợi ý để hỗ trợ người dùng. Nghiên cứu này tiến hành nghiên cứu chuyên sâu sử dụng các mô hình ngôn ngữ âm thanh đa phương thức quy mô lớn làm tác nhân nghe lén để hỗ trợ Dungeon Master trong bối cảnh trò chơi Dungeons & Dragons. Chúng tôi đánh giá khả năng sử dụng của các tác nhân này thông qua các đánh giá của con người và nhận thấy rằng một số mô hình ngôn ngữ âm thanh quy mô lớn có khả năng thực hiện các tác vụ tác nhân nghe lén bằng cách sử dụng các tín hiệu âm thanh ngầm định. Cuối cùng, chúng tôi phát hành một thư viện Python và mã dự án để hỗ trợ nghiên cứu sâu hơn về mô hình tác nhân nghe lén ( https://github.com/zhudotexe/overhearing_agents ).
Chúng tôi đề xuất một mô hình mới cho các tác nhân LLM đàm thoại, "tác nhân nghe lén" và khám phá các khả năng của nó.
◦
Chúng tôi chứng minh tiềm năng của một mô hình ngôn ngữ âm thanh đa phương thức quy mô lớn có thể hoạt động như một tác nhân nghe lén trong bối cảnh cụ thể của trò chơi Dungeons & Dragons.
◦
Khả năng thực hiện nhiệm vụ bằng tín hiệu âm thanh ngầm đã được phát hiện trong một số mô hình quy mô lớn.
◦
Chúng tôi hỗ trợ nghiên cứu tiếp theo bằng cách phát hành các thư viện và mã Python liên quan.
•
Limitations:
◦
Vì nghiên cứu này chỉ giới hạn trong bối cảnh cụ thể của trò chơi Dungeons & Dragons nên cần nghiên cứu thêm để xác định khả năng khái quát hóa của nó sang các bối cảnh khác.
◦
Không có thông tin chi tiết về loại và hiệu suất của các mô hình quy mô lớn được sử dụng.
◦
Thiếu sự thảo luận về vấn đề riêng tư và đạo đức của các tác nhân nghe lén.