Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

AgentArmor: Thực thi phân tích chương trình trên Agent Runtime Trace để phòng chống tấn công Prompt Injection

Created by
  • Haebom

Tác giả

Peiran Wang, Yang Liu, Yunfei Lu, Yifeng Cai, Hongbo Chen, Qingyou Yang, Jie Zhang, Jue Hong, Ye Wu

Phác thảo

Bài báo này trình bày một phương pháp tiếp cận mới để giải quyết các lỗ hổng bảo mật trong các tác nhân Mô hình Ngôn ngữ Quy mô Lớn (LLM), đặc biệt là nguy cơ bị tấn công chèn mã nhanh, bằng cách xử lý các dấu vết thực thi tác nhân như các chương trình có cấu trúc. Chúng tôi đề xuất một khung phân tích chương trình, AgentArmor, giúp chuyển đổi các dấu vết tác nhân thành các biểu diễn trung gian đồ thị (CFG, DFG, PDG, v.v.) và thực thi các chính sách bảo mật thông qua một hệ thống kiểu. AgentArmor bao gồm ba thành phần chính: một trình tạo đồ thị, một sổ đăng ký thuộc tính và một hệ thống kiểu. Bằng cách biểu diễn hành vi của tác nhân dưới dạng một chương trình có cấu trúc, nó cho phép phân tích chương trình đối với các luồng dữ liệu nhạy cảm, ranh giới tin cậy và các vi phạm chính sách. Kết quả đánh giá sử dụng chuẩn AgentDojo cho thấy AgentArmor giảm ASR xuống 3% và giới hạn suy giảm tiện ích xuống 1%.

Takeaways, Limitations

Takeaways:
Cung cấp giải pháp hiệu quả cho vấn đề lỗ hổng bảo mật của các tác nhân LLM.
Cho phép sử dụng các kỹ thuật phân tích tĩnh bằng cách chuyển đổi dấu vết thực thi của tác nhân thành các chương trình có cấu trúc để phân tích.
AgentArmor có thể giúp giảm thiểu các mối đe dọa bảo mật do các cuộc tấn công tiêm mã độc nhanh chóng gây ra.
Kết quả thử nghiệm xác minh tính hiệu quả và tính thực tiễn của AgentArmor.
Limitations:
Cần nghiên cứu thêm về hiệu suất và tính hiệu quả của AgentArmor.
Việc xác minh khả năng áp dụng là bắt buộc đối với nhiều loại tác nhân và môi trường LLM khác nhau.
Cần xác minh tính chính xác và hạn chế của việc phân tích hành vi tác nhân phức tạp
Cần đánh giá khả năng thích ứng với các loại tấn công hoặc thiết kế tác nhân mới
👍