Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Giải mã tránh né cho việc tạo ra nhiều câu chuyện đa nhánh

Created by
  • Haebom

Tác giả

Công viên Kyeongman, Nakyeong Yang, Kyomin Jung

Phác thảo

Bài báo này đề xuất một chiến lược giải mã mới, Giải mã Tránh né, để giải quyết vấn đề của các mô hình ngôn ngữ quy mô lớn (LLM) tạo ra các đầu ra lặp lại và đơn điệu do tính đa dạng sáng tạo hạn chế cho cùng một lời nhắc đầu vào, đặc biệt là trong các tác vụ như tạo câu chuyện. Giải mã Tránh né sửa đổi các logit mã thông báo bằng cách phạt sự tương đồng với các đầu ra đã tạo trước đó, do đó khuyến khích các câu chuyện đa nhánh đa dạng hơn. Hình phạt này được cân bằng một cách thích ứng, ưu tiên các hình phạt về sự tương đồng ở cấp độ khái niệm trong giai đoạn đầu để thúc đẩy tính đa dạng trong các khái niệm câu chuyện ban đầu và dần dần nhấn mạnh các hình phạt về sự tương đồng ở cấp độ tường thuật trong các giai đoạn sau để đảm bảo sự phát triển cốt truyện tự nhiên nhưng đa dạng. Phương pháp được đề xuất đạt được tính đa dạng đầu ra cao hơn tới 2,6 lần so với các phương pháp hiện có, giảm sự lặp lại trung bình 30% và giảm thiểu hiệu quả sự suy thoái văn bản. Hơn nữa, chúng tôi chứng minh rằng phương pháp này kích hoạt một phạm vi rộng hơn các tế bào thần kinh, do đó tận dụng được tính sáng tạo vốn có của mô hình.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày giải mã tránh, một chiến lược giải mã mới giúp cải thiện tính đa dạng đầu ra của LLM.
ĐạT được sự đa dạng đầu ra và giảm thiểu sự lặp lại cao hơn đáng kể so với các phương pháp hiện có.
Giảm thiểu vấn đề suy giảm chất lượng văn bản.
Thể hiện tính sáng tạo vốn có của LLM.
Limitations:
Cần có thêm các thí nghiệm để đánh giá hiệu suất tổng quát của phương pháp đề xuất.
Cần phải xác minh khả năng áp dụng cho các loại LLM và công việc khác nhau.
Cần nghiên cứu thêm để xác định tỷ lệ tối ưu giữa mức phạt tương đồng ở cấp độ khái niệm và cấp độ mô tả.
👍