Bài báo này thảo luận về lượng tử hóa, một kỹ thuật nén được sử dụng rộng rãi để giảm bộ nhớ và chi phí tính toán của các mô hình quy mô lớn được đào tạo trước. Đặc biệt, việc lựa chọn một hệ số tỷ lệ phù hợp để thay thế các giá trị trọng số bằng các giá trị trên lưới số nguyên tỷ lệ là một thách thức quan trọng trong lượng tử hóa sau đào tạo theo kênh (PTQ). Các phương pháp hiện có thường cố định tỷ lệ trước thông qua điều chỉnh theo kinh nghiệm hoặc tìm kiếm lưới. Trong bài báo này, chúng tôi đề xuất Beacon, một thuật toán đơn giản và hiệu quả giúp loại bỏ nhu cầu điều chỉnh thủ công. Beacon thực hiện PTQ theo kênh trực tiếp bằng cách sử dụng lưới không tỷ lệ và tự động xác định hệ số tỷ lệ tối ưu bằng cách tận dụng các đặc tính hình học của lượng tử hóa vô hướng. Nó không dựa vào truyền ngược hoặc các tập hiệu chuẩn lớn. Mặc dù đơn giản và không cần điều chỉnh, Beacon đạt được hiệu suất cạnh tranh so với các phương pháp tiên tiến, khiến nó trở thành một giải pháp thiết thực cho việc triển khai mô hình hiệu quả.