Bài báo này trình bày một phương pháp tiếp cận mới để cải thiện khả năng ra quyết định theo thời gian thực trong mạng 6G bằng cách tận dụng các tác nhân tự động dựa trên các mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi đặt mục tiêu vượt ra khỏi AI truyền thống tập trung vào các tác vụ cụ thể và hướng tới các mạng dựa trên Trí tuệ Nhân tạo Tổng quát (AGI) với khả năng suy luận rộng hơn. Để đạt được điều này, chúng tôi đề xuất một mô hình mới gọi là "tác nhân cộng sinh", kết hợp các LLM với các thuật toán tối ưu hóa thời gian thực. Một bộ tối ưu hóa giai đoạn đầu vào quản lý sự không chắc chắn cho các tác vụ chính xác về mặt số học, trong khi một bộ tối ưu hóa giai đoạn đầu ra thực hiện điều khiển thời gian thực thích ứng dưới sự giám sát của các LLM. Chúng tôi thiết kế và triển khai một hệ thống đa tác nhân để đàm phán các thỏa thuận mức dịch vụ (SLA) với một bộ tối ưu hóa mạng truy cập vô tuyến (RAN), và trình bày kết quả thử nghiệm bằng cách sử dụng nền tảng thử nghiệm 5G. Kết quả thử nghiệm cho thấy các tác nhân cộng sinh giảm lỗi ra quyết định gấp năm lần so với các LLM tác nhân đơn lẻ. Sử dụng các mô hình ngôn ngữ quy mô nhỏ (SLM), chúng tôi đạt được độ chính xác tương tự trong khi giảm 99,9% mức sử dụng tài nguyên GPU. Bản trình diễn về sự cộng tác của nhiều tác nhân trên nền tảng thử nghiệm thực tế cho thấy tính linh hoạt của SLA và phân bổ tài nguyên, giúp giảm tình trạng sử dụng quá mức RAN khoảng 44%.