Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Học phí Thạc sĩ Luật (LLM) của bạn có quá cao không? Mã hóa, Minh bạch và Khuyến khích

Created by
  • Haebom

Tác giả

Ander Artola Velasco, Stratis Tsirtsis, Nastaran Okati, Manuel Gomez-Rodriguez

Phác thảo

Bài báo này phân tích các lỗ hổng của cơ chế định giá theo token được sử dụng trong các dịch vụ đám mây cho các mô hình ngôn ngữ quy mô lớn (LLM). Cơ chế định giá dựa trên token hiện tại khuyến khích các nhà cung cấp dịch vụ tối đa hóa lợi nhuận bằng cách báo cáo sai số lượng token được sử dụng trong kết quả đầu ra của mô hình, khiến người dùng không có cách nào để xác minh điều này. Chúng tôi chứng minh lỗ hổng này và đề xuất một thuật toán heuristic hiệu quả cho phép các nhà cung cấp dịch vụ tính phí mà không bị nghi ngờ. Hơn nữa, chúng tôi chứng minh rằng việc định giá token phụ thuộc tuyến tính vào số lượng ký tự trong token để loại bỏ động cơ này, từ đó đề xuất một phương pháp duy trì lợi nhuận trung bình. Chúng tôi bổ sung các phát hiện lý thuyết của mình bằng các kết quả thực nghiệm sử dụng nhiều LLM từ các họ Llama, Gemma và Ministral, cũng như các lời nhắc từ nền tảng LMSYS Chatbot Arena.

Takeaways, Limitations

Takeaways:
Cơ chế định giá dựa trên mã thông báo hiện tại khiến các nhà cung cấp dịch vụ LLM dễ bị thao túng trong hoạt động thanh toán.
Chúng tôi đề xuất rằng việc định giá mã thông báo theo tuyến tính với số lượng ký tự trong mã thông báo là một cách hiệu quả để loại bỏ động cơ thao túng.
Chúng tôi đề xuất một phương pháp để các nhà cung cấp áp dụng cơ chế định giá theo khuyến khích trong khi vẫn duy trì biên lợi nhuận hiện tại.
Limitations:
Thuật toán tìm kiếm được đề xuất không ngăn chặn hoàn toàn việc thao túng hóa đơn và không phải là giải pháp hoàn hảo cho hành vi chiến lược của nhà cung cấp.
Thí nghiệm này chỉ giới hạn ở một LLM và lời nhắc cụ thể, và cần nghiên cứu thêm để xác định khả năng khái quát hóa của nó.
Cần cân nhắc thêm xem liệu việc định giá mã thông báo theo tuyến tính dựa trên số ký tự trong mã thông báo có thực tế trong mọi tình huống hay không.
👍