Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Sự hội tụ Nash của các thuật toán học tập dựa trên trung bình trong đấu giá giá đầu tiên

Created by
  • Haebom

Tác giả

ĐặNg Tiểu Thiết, Hồ Xinyan, Tao Lin, Weiqiang Zheng

Phác thảo

Bài báo này phân tích các tính chất hội tụ của động lực học trong các phiên đấu giá giá đầu tiên lặp lại, trong đó những người trả giá có giá trị cố định sử dụng các thuật toán dựa trên giá trị trung bình (bao gồm các thuật toán không hối tiếc như Cập nhật trọng số nhân và Theo dõi người dẫn đầu bị nhiễu loạn). Chúng tôi mô tả đầy đủ động lực học của các thuật toán dựa trên giá trị trung bình theo hai khái niệm hội tụ: hội tụ trung bình theo thời gian (phần thời gian mà người trả giá chơi trò cân bằng Nash hội tụ về 1) và hội tụ lần lặp cuối cùng (hồ sơ chiến lược hỗn hợp của người trả giá hội tụ về cân bằng Nash). Kết quả hội tụ phụ thuộc vào số lượng người trả giá có giá trị cao nhất. Nếu có ba hoặc nhiều người trả giá có giá trị cao nhất, cân bằng Nash gần như chắc chắn sẽ hội tụ theo cả trung bình theo thời gian và lần lặp cuối cùng; nếu có hai người trả giá có giá trị cao nhất, cân bằng Nash hội tụ theo trung bình theo thời gian nhưng không nhất thiết phải ở lần lặp cuối cùng; và nếu có một người trả giá cao nhất, cân bằng Nash có thể không hội tụ ở giá trị trung bình theo thời gian hoặc lần lặp cuối cùng.

Takeaways, Limitations

_____T118477____-: Chúng tôi trình bày một mô tả đầy đủ về đặc điểm hội tụ của các thuật toán học dựa trên giá trị trung bình trong các phiên đấu giá lặp lại, mang lại _____T118478____- tiềm năng cho nhiều ứng dụng khác nhau, bao gồm cả thị trường quảng cáo trực tuyến. Đặc biệt, chúng tôi tiết lộ sự khác biệt trong kết quả hội tụ tùy thuộc vào số lượng người trả giá cao nhất, gợi ý những khả năng mới cho việc nghiên cứu động lực học tập.
Limitations: Phân tích chỉ giới hạn ở các thuật toán dựa trên giá trị trung bình, hạn chế khả năng khái quát hóa sang các loại thuật toán học khác. Hơn nữa, phân tích giả định giá trị của người trả giá cố định, do đó kết quả có thể thay đổi trong các trường hợp giá trị dao động. Cuối cùng, việc hội tụ ở lần lặp cuối cùng không được đảm bảo khi có hai người trả giá cao nhất đòi hỏi phải nghiên cứu thêm.
👍