Bài báo này trình bày kết quả phân tích so sánh các chiến lược quản lý lịch sử ngữ cảnh dài trong một tác nhân kỹ thuật phần mềm (SWE) dựa trên mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi đã so sánh các phương pháp tóm tắt dựa trên LLM hiện có, chẳng hạn như OpenHands và Cursor, với phương pháp che ngữ cảnh quan sát, một phương pháp đơn giản bỏ qua các quan sát trước đó, sử dụng nhiều cấu hình mô hình trên tập dữ liệu SWE-bench Verified. Chúng tôi nhận thấy rằng chiến lược che ngữ cảnh quan sát đạt được tỷ lệ giải quyết vấn đề tương tự hoặc cao hơn một chút so với các phương pháp tóm tắt dựa trên LLM, đồng thời giảm một nửa chi phí. Ví dụ, trên mô hình Qwen3-Coder 480B, phương pháp che ngữ cảnh quan sát đã cải thiện tỷ lệ giải quyết vấn đề từ 53,8% lên 54,8%, đạt hiệu suất tương tự như tóm tắt LLM với chi phí thấp hơn. Nghiên cứu này cho thấy, ít nhất là trong môi trường SWE-agent và SWE-bench Verified, cách quản lý ngữ cảnh hiệu quả và hiệu suất nhất có thể là cách tiếp cận đơn giản nhất. Để có thể tái tạo, chúng tôi cung cấp mã và dữ liệu.