Trong bài báo này, chúng tôi đề xuất một kỹ thuật lượng tử hóa sau học độ chính xác hỗn hợp mới, Lượng tử hóa Mạch tác vụ (TaCQ), để giải quyết vấn đề suy giảm hiệu suất trong lượng tử hóa bit thấp (2-3 bit). TaCQ hoạt động bằng cách trực tiếp điều chỉnh quá trình lượng tử hóa trên mạch trọng số, là một tập hợp các trọng số liên quan đến hiệu suất của một tác vụ cụ thể. Các trọng số quan trọng đối với hiệu suất của một tác vụ cụ thể được giữ nguyên ở dạng 16 bit và các trọng số còn lại được lượng tử hóa, do đó giảm hiệu quả việc sử dụng bộ nhớ đồng thời giảm thiểu sự suy giảm hiệu suất. Chúng tôi sử dụng thông tin gradient để dự đoán những thay đổi trọng số do lượng tử hóa và tác động của chúng đến hiệu suất tác vụ, đồng thời chứng minh bằng thực nghiệm rằng phương pháp này vượt trội hơn các phương pháp hiện có trên nhiều tác vụ (QA, suy luận toán học, chuyển đổi văn bản sang SQL) và các mô hình (Llama-3, Qwen2.5) bằng cách sử dụng cả dữ liệu mục đích chung và dữ liệu cụ thể của tác vụ. Đặc biệt, phương pháp này đạt được những cải tiến hiệu suất đáng kể so với các phương pháp tiên tiến hiện có trong môi trường lượng tử hóa 2 bit và 3 bit.