Bài báo này đề xuất RIDGECUT, một khuôn khổ mới để áp dụng học tăng cường (RL) vào các bài toán tối ưu hóa tổ hợp, đặc biệt là bài toán Cắt chuẩn hóa. Để giải quyết khó khăn trong việc kết hợp kiến thức miền, một hạn chế của các phương pháp dựa trên RL hiện có, chúng tôi đề xuất một phương pháp tận dụng kiến thức miền để giới hạn không gian hành động. Lấy ví dụ về mạng lưới đường đô thị, chúng tôi biến đổi đồ thị thành cấu trúc tuyến tính hoặc tròn bằng cách sử dụng các cấu trúc đường đồng tâm và xuyên tâm, và thực hiện học hiệu quả bằng cách sử dụng các bộ biến đổi tuần tự. Kết quả là, chúng tôi đạt được các giá trị Cắt chuẩn hóa thấp hơn so với các phương pháp hiện có và tạo ra các phân vùng phù hợp chặt chẽ với bố cục không gian. Mặc dù nghiên cứu này tập trung vào dữ liệu giao thông, chúng tôi cung cấp một cơ chế chung để kết hợp kiến thức cấu trúc trước đó về các bài toán phân vùng đồ thị vào RL.